AI/GenAI

OpenSearch és vektor keresés az AWS-en: Alaptechnológia a skálázható mesterséges intelligenciához

Tar Péter

Tech Lead

2025.08.07

Vektoralapú keresés az OpenSearch erejével

Miért kell újragondolni a keresést az AI korszakában?

A hagyományos keresési technológiák hosszú ideig kielégítő megoldást nyújtottak a strukturált és félig strukturált információk elérésére. Kulcsszavak, kifejezések, Boole-operátorok - ezek voltak a keresés sarokkövei. Azonban a mesterséges intelligencia fejlődése, különösen a nagy nyelvi modellek megjelenése (LLM) alapjaiban változtatta meg az elvárásainkat. A felhasználók ma már nem csupán találatokat várnak, hanem értelmes, releváns és kontextusban helyes válaszokat.

Az új igények új megközelítéseket követelnek. Az egyik leghatékonyabb ilyen megközelítés a vektor alapú keresés, amely már nem csupán a szavak előfordulását, hanem azok mögöttes jelentését is képes értelmezni. Az OpenSearch, különösen az AWS-en elérhető, menedzselt formájában, kiváló eszközt kínál az ilyen rendszerek kialakításához.

A keresőmotorok fejlődése – a kulcsszavaktól a jelentésig

A keresés története a kulcsszavas modellek korszakával kezdődött, amikor a rendszerek egyszerű szóegyezések alapján határozták meg a találatokat. A lekérdezések és a dokumentumok közötti kapcsolat pusztán az azonos kifejezések meglétére épült. Ezeket egészítették ki a Boole-operátorok, amelyek lehetővé tették az egyszerű logikai kapcsolatok megadását, de valódi nyelvi vagy szemantikai értelmezés nem történt.

A következő jelentős lépés a relevancia-alapú algoritmusok bevezetése volt, például a TF-IDF vagy a BM25. Ezek már figyelembe vették, hogy egy adott kifejezés mennyire jellemző az adott dokumentumra a teljes dokumentumhalmazhoz képest, és ennek megfelelően súlyozták az eredményeket. Így már hatékonyabb lett a keresés, de továbbra is a felszíni egyezéseken alapult.

Az NLP (Neuro Lingvisztikus Programozás) technológiák integrálása hozta el azt az időszakot, amikor a keresők képessé váltak a nyelvi alakok, szinonimák, és egyszerű nyelvtani szerkezetek felismerésére és kezelésére. Bár ez már előrelépést jelentett a kontextus figyelembe vételében, még mindig nem tudta kezelni a komplex fogalmi összefüggéseket vagy a többértelműséget.

A valódi áttörést az jelentette, amikor az AI-alapú modellek lehetővé tették a szövegek vektoros reprezentációját. A BERT, GPT és hasonló modellek segítségével a szövegeket sokdimenziós térben helyezhetjük el, ahol az egymáshoz jelentésben közel álló szövegrészek a térben is közel kerülnek egymáshoz. Ez tette lehetővé a vektor alapú keresés bevezetését, ahol már nem konkrét szavakra, hanem fogalmakra, szándékokra és jelentésekre keresünk.

Hogyan működik egy vektor adatbázis?

A vektor alapú keresés középpontjában az embedding fogalma áll. Egy embedding nem más, mint egy szövegrészlet – legyen az egy mondat, egy kérdés vagy akár egy teljes dokumentum – numerikus leképezése egy sokdimenziós térbe. Ezt a leképezést jellemzően nagy nyelvi modellek végzik, amelyek képesek a szöveg jelentését tömör, de informatív numerikus formában kifejezni.

A keresés ebben a rendszerben úgy történik, hogy a felhasználói lekérdezést is embeddinggé alakítjuk, majd összehasonlítjuk az adatbázisban szereplő vektorokkal. A hasonlóságot különböző matematikai metrikák alapján számítjuk ki – leggyakrabban koszinusz azonosság vagy euklideszi távolság segítségével. A találati lista azokból az elemekből áll össze, amelyek vektora legközelebb esik a lekérdezés vektorához, ezt nevezzük K legközelebbi szomszéd (KNN) keresésnek.

Ez a módszer különösen jól használható olyan területeken, ahol a keresett információ nem egyértelműen definiált kulcsszavakon múlik. Ilyen például az AI-alapú chatbotok tudásbázisa, ahol a válaszokat nem előre definiált szabályok alapján adják meg, hanem kontextusfüggő relevancia szerint. Ugyanez a megközelítés alkalmas dokumentumkeresésre nagyvállalati környezetben, vagy akár képek, hanganyagok és egyéb multimédia-tartalmak hasonlóságon alapuló visszakeresésére.

OpenSearch mint vektor adatbázis

Az OpenSearch egy nyílt forráskódú keresőmotor, amely az Elasticsearch közösségi változatából fejlődött ki, és jelenleg az Amazon támogatásával működik. A rendszer moduláris felépítésű, REST API-kat használ, és kiválóan alkalmas strukturált és félig strukturált adatok tárolására, indexelésére és keresésére. Az utóbbi években beépítették a vektor alapú keresés támogatását is, így az OpenSearch mára teljes értékű vektor adatbázissá vált.

Az OpenSearch vektoros keresését a knn_vector típus segítségével lehet elérni, amely vektorokat képes tárolni a dokumentumok mezőiben. A keresés a háttérben az úgynevezett HNSW (Hierarchical Navigable Small World) algoritmus alapján történik, amely hatékonyan képes nagy vektorterekben gyors hasonlósági keresést végrehajtani. A rendszer emellett támogatja a deduplikálást és az ismétlődő tartalmak felismerését, valamint lehetővé teszi a kombinált – azaz egyszerre klasszikus és vektoros – keresések futtatását is. Nagyobb volumenű keresési feladatokhoz GPU-támogatás is integrálható, ami tovább növeli a teljesítményt.

OpenSearch az AWS-en mint AI tudásbázis

Az AWS-en elérhető OpenSearch Service egy teljes mértékben menedzselt szolgáltatás, amely megkíméli a felhasználót a klaszterek kézi konfigurálásától és karbantartásától. A szolgáltatás automatikusan skálázódik, magas rendelkezésre állást biztosít, és integrált biztonsági megoldásokat kínál, mint az IAM-alapú hozzáférés-szabályozás és a VPC-integráció. A rendszer node-szerepkörök szerint működik, így elkülöníthetők az adat-, indexelési- és koordinációs feladatokat ellátó erőforrások.

A legújabb fejlesztés az OpenSearch Serverless, amely lehetővé teszi a klasztermentes működést. Ez azt jelenti, hogy nem kell előre kapacitást foglalni vagy méretezni, a rendszer automatikusan kezeli az erőforrásokat a lekérdezések és adatbetöltések alapján. Ez különösen előnyös dinamikusan változó terhelésű, AI-vezérelt rendszerek esetén.

A vektoros OpenSearch-tudásbázis kulcsszerepet játszik a RAG (Retrieval-Augmented Generation) típusú AI-architektúrákban. Ezek célja, hogy a nagy nyelvi modellek válaszadás előtt a tudásbázisban keressenek információt, így csökkentve a pontatlan, kitalált válaszok, hallucinációk arányát. A folyamat során az adatok először strukturálatlan formában (pl. PDF vagy Word dokumentumként) kerülnek be, majd feldolgozás után embeddinggé alakítva indexelődnek az OpenSearch-be. A chatbot vagy AI-asszisztens ezután ezekből az embeddingekből keres releváns információkat, mielőtt választ generál.

Előnyök és kihívások

Az OpenSearch egyik legnagyobb előnye, hogy nyílt forráskódú, így szabadon testreszabható és bárhova kitelepíthető. A rendszer natívan integrálható AWS-környezetbe, és támogatja a klasszikus, valamint a vektoros keresés együttes használatát, ami hibrid keresési stratégiák kialakítását is lehetővé teszi. A skálázhatóság, a megbízhatóság és az automatizálás lehetőségei mind hozzájárulnak a gyors üzembe helyezéshez és a hosszú távú fenntarthatósághoz.

Ugyanakkor néhány kihívással is számolni kell. Az embedding generálása számításigényes művelet, különösen nagy adatállomány esetén. A HNSW algoritmus paramétereinek finomhangolása szakértelmet kíván, és az indexek frissítése, reindexelése szintén komplexitással járhat, különösen akkor, ha a tudásbázis gyakran változik.

A keresés jövője

Ahogy az információmennyiség növekszik és a felhasználói elvárások egyre komplexebbé válnak, világossá válik, hogy a keresés jövője nem a kulcsszavakban, hanem a jelentésben rejlik. A kontextus-érzékeny, intelligens keresés nemcsak kényelmet, hanem pontosságot is biztosít.

Az OpenSearch - különösen az AWS-en futtatott, menedzselt vagy serverless változatban - lehetővé teszi az ilyen rendszerek kiépítését nyílt, skálázható és integrálható módon. A klasszikus és vektoros keresési megközelítések kombinációja pedig új távlatokat nyit a tudásalapú rendszerek, AI asszisztensek és információ-elérési megoldások számára.

Ha szeretnél többet is megtudni az Amazon OpenSearch működéséről használati lehetőségeiről, vedd fel velünk a kapcsolatot!