A kontextusalapú mérnöki munka megöli a gyors mérnöki munkát – Íme, miért

Kontextusmérnökség Miért okos? AI A mérnökök elhagyták a gyors mérnöki munkát

A gyors módosítások önmagukban már nem elégek a vállalatok számára AI rendszerek. Ahogy a modell kontextus ablakai meghaladják a 200 ezer tokent, a mérnökök most dokumentumokkal, visszakeresési folyamatokkal, munkafüzetekkel és eszközhívásokkal látják el az LLM-et – ezt a megközelítést a cég kontextusmérnöki.

A váltás gyorsan történt.

Tavaly varázslatnak tűnt az ötletes feladatok írása. Ma a vállalati AI igények strukturált kimenetekvalós idejű adatintegrációés beszélgetés memória amit egyszerű utasításokkal nem lehet megvalósítani.

A kontextusmérnökség áthidalja ezt a szakadékot azáltal, hogy a teljes AI környezet rendszerként, ahelyett, hogy az egyes bemenetekre összpontosítanánk.

Kontextusmérnökség:
A rendszer, ami tényleg működik

A kontextusmérnökség az LLM hívás előtti teljes folyamatot tervezhető infrastruktúraként kezeli. Gondoljon egy LLM-re.'s a kontextuális ablakot RAM-ként kezeli – korlátozott munkamemóriával rendelkezik, amely meghatározza, hogy mit képes feldolgozni a modell.

A kontextusmérnökség megértése

Ahogyan egy operációs rendszer gondosan kezeli, hogy mi kerül a RAM-ba, úgy a kontextusmérnökség is gondosan kezeli, hogy milyen információk töltik meg az LLM-et.'s kontextus ablak.

Itt's Mit foglal magában a kontextusmérnökség valójában:

Dinamikus információgyűjtés: RAG rendszerek, API-hívások, adatbázis-lekérdezések
MemóriakezelésRövid távú beszélgetési állapot és hosszú távú tudás
EszközkoordinációKülső függvények elérhetővé tétele szükség esetén
Kimeneti strukturálásSémák és formátumok meghatározása a konzisztens eredmények érdekében

Kontextusmérnökség vs. Promptmérnökség:
A számok nem hazudnak

AspectPrompt EngineeringKontextusmérnökség
ÖsszpontosítEgy bemeneti karakterlánc létrehozásaA modell körüli összes jel összehangolása
Átlagos fejlesztési idő70%-ban azonnali módosítások60% adatfolyamatok, 20% memóriaszabályok, 20% promptok
Tipikus hibamódA kimeneti minőség hirtelen visszaesése adateltolódás utánRugalmas RAG, memória és eszközhívások segítségével

Gyors példa: Egy ügyfélszolgálati bot A kizárólag promptokkal betanított botok közvetlenül a kérdésre vissza tudják hívni a visszatérítési szabályzatot. Amikor a felhasználó a „45791-es rendelésre” hivatkozik, a folyamat sikertelen. Adjunk hozzá kontextus-mérnöki megoldást – beszélgetési előzményeket és egy RAG-lekérdezést a rendelési adatbázisba –, és a bot azonnal lekéri a vásárlás részleteit, és javasolja a megfelelő visszatérítési folyamatot.

A kontextusmérnökség négy pillére, amelyek valóban számítanak

1. Írási kontextus (a mesterséges intelligencia's Jegyzetkészítő rendszer)

A kontextus írása azt jelenti, hogy az információkat a kontextuson kívül is tároljuk. kontextus ablak későbbi felhasználásra. Ez értékes tokenterületet takarít meg, miközben fenntartja a hozzáférést a fontos adatokhoz.

Fióktömbök úgy működik, mint a jegyzetelés az ügynökök számára egyetlen munkameneten belül. Antropic's a többágensű kutató elmenti a kezdeti tervét a következőre: „Memory design„Mert ha a kontextus meghaladja a 200,000 XNUMX tokent, akkor csonkolódik, és a terv elveszik.”

Hosszú távú emlékek információk megőrzése több munkameneten keresztül. Ilyen például a ChatGPT automatikus felhasználói beállítások generálása a beszélgetésekből, valamint a kurzor/szörf tanulása kódolási minták és a projekt kontextusa.

2. Kontextusválasztás (A fontos dolgok kiválasztásának művészete)

A kontextus kiválasztása csak a feladathoz szükséges információkat tartalmazza.

Ha egy AI fitnesz edző edzéstervet generál, ki kell választania a felhasználót is tartalmazó kontextusadatokat's magasság, súly és aktivitási szint, miközben figyelmen kívül hagyja a lényegtelen információkat.

A legfontosabb betekintésA több információ nem mindig jobb. A hatékony kontextus-tervezés azt jelenti, hogy minden egyes feladathoz a megfelelő kombinációt kell kiválasztani.

3. Kontextustömörítés (Több beleillesztése kevesebbbe)

Amikor a beszélgetések annyira elnyúlnak, hogy meghaladják a LLM's emlékezet ablakban a kontextus tömörítése kritikus fontosságúvá válik. Az ügynökök ezt jellemzően a beszélgetés korábbi részeinek összefoglalásával érik el.

Példa:
50 üzenet után egy AI Az edző így foglalhatná össze: „A felhasználó egy 35 éves, 180 kg-os férfi, izomtömeg-növelésre törekszik, mérsékelten aktív, sérülésmentes, és magas fehérjetartalmú étrendet részesít előnyben”.

4. Kontextusbeli izoláció (Oszd meg és uralkodj)

Kontextusmérnöki technika - Kontextus izolálása

A kontextus elkülönítése az információk különálló részekre bontását jelenti, hogy az ágensek jobban tudják kezelni az összetett feladatokat. Ahelyett, hogy az összes tudást egyetlen hatalmas promptba zsúfolnák, a fejlesztők a kontextust specializált alágensek vagy... homokozós környezetek.

Valós kontextusú mérnöki munka a gyakorlatban

Az ügyfélszolgálat forradalma

A kontextusmérnökség előttKontextusmérnökség után
Általános chatbotok, amik elfelejtik a korábbi beszélgetéseket és irreleváns válaszokat adnak.AI ügynökök, akik megjegyzik a vásárlási előzményeidet, hozzáférnek a valós idejű készletadatokhoz, és szükség esetén együttműködnek az emberi ügynökökkel.

A kódoló asszisztens, amely soha nem felejt

A rendszerAmikor a „Hogyan javíthatom ki ezt a hitelesítési hibát?” kérdésre válaszolsz, a kontextusmérnöki rendszer automatikusan:

Kapcsolódó kódot keres a kódbázisban
Releváns fájlrészletek lekérése
Átfogó promptot hoz létre hibanaplókkal és kontextussal
giphy
Az eredmény:

Általános kódolási tanácsok helyett konkrét megoldásokat kapsz, amelyek a tényleges kódbázisodra vannak szabva.

A kontextusmérnöki tevékenységet működtető műszaki architektúra

Dinamikus kontextus összeállítás

A kontextus menet közben épül fel, és a beszélgetések előrehaladtával fejlődik. Ez magában foglalja:

  • Releváns dokumentumok lekérése
  • A memória megőrzése
  • Felhasználói állapot frissítése
  • API-hívások és adatbázis-lekérdezések

Kontextuális ablakkezelés

Fix mérettel token limitek (32K, 100K, 1M) esetén a mérnököknek intelligensen kell tömöríteniük és rangsorolniuk az információkat a következők használatával:

  • Pontozási függvények (TF-IDF, beágyazások, figyelemheurisztikák)
  • Összefoglalás és jelentőségkivonás
  • Darabolási stratégiák és átfedéses hangolás

Biztonság és következetesség

Alkalmazzon olyan elveket, mint az injekció azonnali felismerése, kontextusfertőtlenítés, Személyazonosításra alkalmas adatok szerkesztéseés szerepköralapú kontextusalapú hozzáférés-vezérlés.

Első kontextusú mérnöki rendszer felépítése

A kontextusmérnöki munkafolyamat felépítése nem csak elmélet – az's egy megismételhető folyamat, amely operacionalizálható és akár automatizálható is. Így ültetheti át a gyakorlatba:

Lépés 1: Térképezd fel a kontextusforrásaidat

Határozza meg, hogy az ügynökének honnan kell információkat gyűjtenie (dokumentumok, adatbázisok, API-k, korábbi csevegések stb.).

piton

# Example: Fetching relevant documents using embeddings
from sentence_transformers import SentenceTransformer, util

model = SentenceTransformer("all-MiniLM-L6-v2")
query = "project status update"
corpus = ["spec doc", "requirements", "last week's meeting notes"]

query_embedding = model.encode(query, convert_to_tensor=True)
corpus_embeddings = model.encode(corpus, convert_to_tensor=True)
hits = util.semantic_search(query_embedding, corpus_embeddings, top_k=2)[0]
relevant_docs = [corpus[hit['corpus_id']] for hit in hits]

Lépés 2: Memória és írási kontextus megvalósítása

Tárolja a fontos információkat, hogy azok mindig kéznél legyenek a jövőbeni feladatokhoz.

piton

import json

def save_to_memory(memory_path, user_id, data):
    with open(memory_path, "r+") as file:
        memory = json.load(file)
        memory[user_id] = data
        file.seek(0)
        json.dump(memory, file)
        file.truncate()

Lépés 3: Kontextuskiválasztás és tömörítési logika felépítése

Szabályokat vagy modelleket dolgozzon ki, amelyek csak a feladat szempontjából legrelevánsabbakat választják ki. Hosszú előzményeket tömörítsen összefoglaló formákba.

piton

def summarize_conversation(history):
    # Placeholder for use with an LLM summarizer or custom rules
    return history[-5:]  # Only the last 5 messages

Lépés 4: Kontextusok elkülönítése az ágenskoordinációhoz

Ossza szét az információkat, hogy minden ügynök vagy komponens csak azt kezelje, amit kell.

piton

user_profile_ctx = {"user_goals": "..."}
task_specific_ctx = {"current_task": "..."}
external_data_ctx = {"live_data": "..."}
full_context = {**user_profile_ctx, **task_specific_ctx, **external_data_ctx}

Lépés 5: Kimeneti strukturálás és API-készség

A kimeneti kontextust egységesen formázd, hogy az's kiszámítható a downstream LLM hívásokhoz vagy API végpontokhoz.

piton

schema = {
    "user": {"age": 35, "goal": "muscle gain"},
    "plan": "high protein, 3x/week weight training"
}

Lépés 6: Monitorozás, iteráció és biztonság

Kövesse nyomon a hibákat, auditálja a kontextus minőségét, és fejlessze a kontextusbeillesztés, a memória és a visszakeresés logikáját. Mindig fertőtlenítse a bemeneteket a gyors injektálás és az adatszivárgás elkerülése érdekében.

Miért fizet jobban a kontextusalapú mérnöki munka, mint a gyorsmérnöki munka

A vállalatoknak olyan mérnökökre van szükségük, akik olyan rendszereket tudnak építeni, amelyek a megfelelő kontextust biztosítják a mesterséges intelligenciának, pontosak és naprakészek maradnak, és biztonsági irányelvek hozzáadásával védik a felhasználókat.

A piaci valóságA kontextusmérnökség olyan funkciókon átívelő készségeket igényel, mint az üzleti felhasználási esetek megértése, a kimenetek meghatározása és az információk strukturálása, hogy az LLM-ek összetett feladatokat tudjanak elvégezni.

Hagy egy Válaszol

E-mail címed nem kerül nyilvánosságra. Kötelező kitölteni *

Ez az oldal Akismet-et használ a levélszemét csökkentése érdekében. Ismerje meg, hogyan dolgozzák fel megjegyzései adatait.

Csatlakozz a Aimojo Törzs!

Csatlakozzon a 76,200 XNUMX+ taghoz, hogy bennfentes tippeket kapjon minden héten! 
🎁 BÓNUSZ: Szerezd meg a 200 dolláros "AI „Mastery Toolkit” INGYENES regisztrációval!

Felkapott AI Eszközök
Szuperskálázható mesterséges intelligencia

Bármely URL-t percek alatt indításra kész hirdetési kampánysá alakíthat Az AI Teljesítményorientált marketingesek és növekedésorientált márkák számára készült hirdetési ügynök

tl;dv

Ne veszítsd el a mondanivalódat. Kezdj el cselekedni minden megbeszélésen. Az AI megbeszélésjegyzet-készítő, amely rögzíti és hasznosítható kimenetté alakítja a beszélgetéseket.

AskYura

Minden ügyfélbeszélgetést befejezett üzleti cselekvéssé alakítson A kód nélküli AI Operatív végrehajtásra készült ügynök

Kuberns

Okosabb telepítés. Gyorsabb skálázás. Akár 40%-kal csökkentheti a felhőköltségeket. A mesterséges intelligencián alapuló Cloud PaaS nulla konfigurációjú, teljes körű telepítéshez készült.

uizard

Ötletekből interaktív prototípusok készítése egyetlen tervezési készség nélkül AI Felhasználói felület tervező eszköz drótvázakhoz, makettekhez és alkalmazásprototípus-készítéshez

© Szerzői jog 2023 - 2026 | Legyen Ön is AI Pro | Készült ♥-val