A kontextusalapú mérnöki munka megöli a gyors mérnöki munkát – Íme, miért

Esettanulmány Útmutatók

by Jaspreet

11 hónap 0 865

Kontextusmérnökség Miért okos? AI A mérnökök elhagyták a gyors mérnöki munkát

A gyors módosítások önmagukban már nem elégek a vállalatok számára AI rendszerek. Ahogy a modell kontextus ablakai meghaladják a 200 ezer tokent, a mérnökök most dokumentumokkal, visszakeresési folyamatokkal, munkafüzetekkel és eszközhívásokkal látják el az LLM-et – ezt a megközelítést a cég kontextusmérnöki.

A váltás gyorsan történt.

Tavaly varázslatnak tűnt az ötletes feladatok írása. Ma a vállalati AI igények strukturált kimenetek, valós idejű adatintegrációés beszélgetés memória amit egyszerű utasításokkal nem lehet megvalósítani.

A kontextusmérnökség áthidalja ezt a szakadékot azáltal, hogy a teljes AI környezet rendszerként, ahelyett, hogy az egyes bemenetekre összpontosítanánk.

Kontextusmérnökség:
A rendszer, ami tényleg működik

A kontextusmérnökség az LLM hívás előtti teljes folyamatot tervezhető infrastruktúraként kezeli. Gondoljon egy LLM-re.'s a kontextuális ablakot RAM-ként kezeli – korlátozott munkamemóriával rendelkezik, amely meghatározza, hogy mit képes feldolgozni a modell.

A kontextusmérnökség megértése

Ahogyan egy operációs rendszer gondosan kezeli, hogy mi kerül a RAM-ba, úgy a kontextusmérnökség is gondosan kezeli, hogy milyen információk töltik meg az LLM-et.'s kontextus ablak.

Itt's Mit foglal magában a kontextusmérnökség valójában:

Dinamikus információgyűjtés: RAG rendszerek, API-hívások, adatbázis-lekérdezések

MemóriakezelésRövid távú beszélgetési állapot és hosszú távú tudás

EszközkoordinációKülső függvények elérhetővé tétele szükség esetén

Kimeneti strukturálásSémák és formátumok meghatározása a konzisztens eredmények érdekében

Kontextusmérnökség vs. Promptmérnökség:
A számok nem hazudnak

Aspect	Prompt Engineering	Kontextusmérnökség
Összpontosít	Egy bemeneti karakterlánc létrehozása	A modell körüli összes jel összehangolása
Átlagos fejlesztési idő	70%-ban azonnali módosítások	60% adatfolyamatok, 20% memóriaszabályok, 20% promptok
Tipikus hibamód	A kimeneti minőség hirtelen visszaesése adateltolódás után	Rugalmas RAG, memória és eszközhívások segítségével

Gyors példa: Egy ügyfélszolgálati bot A kizárólag promptokkal betanított botok közvetlenül a kérdésre vissza tudják hívni a visszatérítési szabályzatot. Amikor a felhasználó a „45791-es rendelésre” hivatkozik, a folyamat sikertelen. Adjunk hozzá kontextus-mérnöki megoldást – beszélgetési előzményeket és egy RAG-lekérdezést a rendelési adatbázisba –, és a bot azonnal lekéri a vásárlás részleteit, és javasolja a megfelelő visszatérítési folyamatot.

A kontextusmérnökség négy pillére, amelyek valóban számítanak

1. Írási kontextus (a mesterséges intelligencia's Jegyzetkészítő rendszer)

A kontextus írása azt jelenti, hogy az információkat a kontextuson kívül is tároljuk. kontextus ablak későbbi felhasználásra. Ez értékes tokenterületet takarít meg, miközben fenntartja a hozzáférést a fontos adatokhoz.

Fióktömbök úgy működik, mint a jegyzetelés az ügynökök számára egyetlen munkameneten belül. Antropic's a többágensű kutató elmenti a kezdeti tervét a következőre: „Memory design„Mert ha a kontextus meghaladja a 200,000 XNUMX tokent, akkor csonkolódik, és a terv elveszik.”

Hosszú távú emlékek információk megőrzése több munkameneten keresztül. Ilyen például a ChatGPT automatikus felhasználói beállítások generálása a beszélgetésekből, valamint a kurzor/szörf tanulása kódolási minták és a projekt kontextusa.

2. Kontextusválasztás (A fontos dolgok kiválasztásának művészete)

A kontextus kiválasztása csak a feladathoz szükséges információkat tartalmazza.

Ha egy AI fitnesz edző edzéstervet generál, ki kell választania a felhasználót is tartalmazó kontextusadatokat's magasság, súly és aktivitási szint, miközben figyelmen kívül hagyja a lényegtelen információkat.

A legfontosabb betekintésA több információ nem mindig jobb. A hatékony kontextus-tervezés azt jelenti, hogy minden egyes feladathoz a megfelelő kombinációt kell kiválasztani.

3. Kontextustömörítés (Több beleillesztése kevesebbbe)

Amikor a beszélgetések annyira elnyúlnak, hogy meghaladják a LLM's emlékezet ablakban a kontextus tömörítése kritikus fontosságúvá válik. Az ügynökök ezt jellemzően a beszélgetés korábbi részeinek összefoglalásával érik el.

Példa:

50 üzenet után egy AI Az edző így foglalhatná össze: „A felhasználó egy 35 éves, 180 kg-os férfi, izomtömeg-növelésre törekszik, mérsékelten aktív, sérülésmentes, és magas fehérjetartalmú étrendet részesít előnyben”.

4. Kontextusbeli izoláció (Oszd meg és uralkodj)

Kontextusmérnöki technika - Kontextus izolálása

A kontextus elkülönítése az információk különálló részekre bontását jelenti, hogy az ágensek jobban tudják kezelni az összetett feladatokat. Ahelyett, hogy az összes tudást egyetlen hatalmas promptba zsúfolnák, a fejlesztők a kontextust specializált alágensek vagy... homokozós környezetek.

Valós kontextusú mérnöki munka a gyakorlatban

Az ügyfélszolgálat forradalma

A kontextusmérnökség előtt	Kontextusmérnökség után
Általános chatbotok, amik elfelejtik a korábbi beszélgetéseket és irreleváns válaszokat adnak.	AI ügynökök, akik megjegyzik a vásárlási előzményeidet, hozzáférnek a valós idejű készletadatokhoz, és szükség esetén együttműködnek az emberi ügynökökkel.

A kódoló asszisztens, amely soha nem felejt

A rendszerAmikor a „Hogyan javíthatom ki ezt a hitelesítési hibát?” kérdésre válaszolsz, a kontextusmérnöki rendszer automatikusan:

Kapcsolódó kódot keres a kódbázisban

Releváns fájlrészletek lekérése

Átfogó promptot hoz létre hibanaplókkal és kontextussal

giphy

Az eredmény:

Általános kódolási tanácsok helyett konkrét megoldásokat kapsz, amelyek a tényleges kódbázisodra vannak szabva.

A kontextusmérnöki tevékenységet működtető műszaki architektúra

Dinamikus kontextus összeállítás

A kontextus menet közben épül fel, és a beszélgetések előrehaladtával fejlődik. Ez magában foglalja:

Releváns dokumentumok lekérése
A memória megőrzése
Felhasználói állapot frissítése
API-hívások és adatbázis-lekérdezések

Kontextuális ablakkezelés

Fix mérettel token limitek (32K, 100K, 1M) esetén a mérnököknek intelligensen kell tömöríteniük és rangsorolniuk az információkat a következők használatával:

Pontozási függvények (TF-IDF, beágyazások, figyelemheurisztikák)
Összefoglalás és jelentőségkivonás
Darabolási stratégiák és átfedéses hangolás

Biztonság és következetesség

Alkalmazzon olyan elveket, mint az injekció azonnali felismerése, kontextusfertőtlenítés, Személyazonosításra alkalmas adatok szerkesztéseés szerepköralapú kontextusalapú hozzáférés-vezérlés.

Első kontextusú mérnöki rendszer felépítése

A kontextusmérnöki munkafolyamat felépítése nem csak elmélet – az's egy megismételhető folyamat, amely operacionalizálható és akár automatizálható is. Így ültetheti át a gyakorlatba:

Lépés 1: Térképezd fel a kontextusforrásaidat

Határozza meg, hogy az ügynökének honnan kell információkat gyűjtenie (dokumentumok, adatbázisok, API-k, korábbi csevegések stb.).

piton

# Example: Fetching relevant documents using embeddings
from sentence_transformers import SentenceTransformer, util

model = SentenceTransformer("all-MiniLM-L6-v2")
query = "project status update"
corpus = ["spec doc", "requirements", "last week's meeting notes"]

query_embedding = model.encode(query, convert_to_tensor=True)
corpus_embeddings = model.encode(corpus, convert_to_tensor=True)
hits = util.semantic_search(query_embedding, corpus_embeddings, top_k=2)[0]
relevant_docs = [corpus[hit['corpus_id']] for hit in hits]

Lépés 2: Memória és írási kontextus megvalósítása

Tárolja a fontos információkat, hogy azok mindig kéznél legyenek a jövőbeni feladatokhoz.

piton

import json

def save_to_memory(memory_path, user_id, data):
    with open(memory_path, "r+") as file:
        memory = json.load(file)
        memory[user_id] = data
        file.seek(0)
        json.dump(memory, file)
        file.truncate()

Lépés 3: Kontextuskiválasztás és tömörítési logika felépítése

Szabályokat vagy modelleket dolgozzon ki, amelyek csak a feladat szempontjából legrelevánsabbakat választják ki. Hosszú előzményeket tömörítsen összefoglaló formákba.

piton

def summarize_conversation(history):
    # Placeholder for use with an LLM summarizer or custom rules
    return history[-5:]  # Only the last 5 messages

Lépés 4: Kontextusok elkülönítése az ágenskoordinációhoz

Ossza szét az információkat, hogy minden ügynök vagy komponens csak azt kezelje, amit kell.

piton

user_profile_ctx = {"user_goals": "..."}
task_specific_ctx = {"current_task": "..."}
external_data_ctx = {"live_data": "..."}
full_context = {**user_profile_ctx, **task_specific_ctx, **external_data_ctx}

Lépés 5: Kimeneti strukturálás és API-készség

A kimeneti kontextust egységesen formázd, hogy az's kiszámítható a downstream LLM hívásokhoz vagy API végpontokhoz.

piton

schema = {
    "user": {"age": 35, "goal": "muscle gain"},
    "plan": "high protein, 3x/week weight training"
}

Lépés 6: Monitorozás, iteráció és biztonság

Kövesse nyomon a hibákat, auditálja a kontextus minőségét, és fejlessze a kontextusbeillesztés, a memória és a visszakeresés logikáját. Mindig fertőtlenítse a bemeneteket a gyors injektálás és az adatszivárgás elkerülése érdekében.

Miért fizet jobban a kontextusalapú mérnöki munka, mint a gyorsmérnöki munka

A vállalatoknak olyan mérnökökre van szükségük, akik olyan rendszereket tudnak építeni, amelyek a megfelelő kontextust biztosítják a mesterséges intelligenciának, pontosak és naprakészek maradnak, és biztonsági irányelvek hozzáadásával védik a felhasználókat.

A piaci valóságA kontextusmérnökség olyan funkciókon átívelő készségeket igényel, mint az üzleti felhasználási esetek megértése, a kimenetek meghatározása és az információk strukturálása, hogy az LLM-ek összetett feladatokat tudjanak elvégezni.

Alsó sor: Bárki írhat promptokat. Kontextus-érzékeny ágenseket kell létrehozni, amelyek nagy léptékben megjegyzik, alkalmazkodnak és kiválasztják a kontextust? Így tehetik a fejlesztők jövőbiztossá képességeiket, és így tudnak valódi értéket teremteni fejlett LLM alkalmazásokkal.

Kontextusmérnökség

További információk

Jó karrierlehetőség-e a gyors mérnöki munka 2026-ban? (Az őszinte, felhajtásmentes válasz)

Jó karrierlehetőség-e a gyors mérnöki munka 2026-ban? (Az őszinte, felhajtásmentes válasz)

2 napja

0 17

Hogy kell írni AI Promptok minden használati esetre (50 valós példa)

Hogy kell írni AI Promptok minden használati esetre (50 valós példa)

1 hete

0 47

Hogyan AI Az ügynökök megváltoztatják az ügyfélszolgálatot (és mit jelent ez az Ön vállalkozása számára)

Hogyan AI Az ügynökök megváltoztatják az ügyfélszolgálatot (és mit jelent ez az Ön vállalkozása számára)

3 héttel ezelőtt

0 53

Hagy egy Válaszol Mégsem válaszát

Ez az oldal Akismet-et használ a levélszemét csökkentése érdekében. Ismerje meg, hogyan dolgozzák fel megjegyzései adatait.

Felkapott AI Eszközök