Történelmi pillanatokat élünk 2023 év elején. A számítógépek megtanultak beszélni…

Mi az a ChatGPT?

A ChatGPT egy beszélgető robot, amely képes interaktív módon kommunikálni a felhasználókkal. A ChatGPT egy olyan nyelvi modell, amelyet az OpenAI nevű kutatócsoport fejlesztett ki, és amely a GPT-3.5 sorozatú modellre épül. A ChatGPT célja, hogy természetes és érdekes beszélgetéseket folytasson különböző témákban, valamint válaszoljon a követő kérdésekre, elismerje a hibáit, kihívja a helytelen feltételezéseket, és elutasítsa a helytelen kéréseket.

A ChatGPT-t úgy „képezték ki”, hogy emberi visszajelzéseket használtak megerősítő tanulás (RLHF) módszerével. Ennek során emberi AI oktatók adtak beszélgetéseket, amelyekben mindkét oldalt játszották – a felhasználót és egy AI asszisztenst. Az oktatók hozzáférést kaptak a modell által írt javaslatokhoz, hogy segítsenek összeállítani a válaszaikat. Ezt az új párbeszéd adathalmazt összekeverték az InstructGPT adathalmazával, amelyet párbeszéd formátumra alakítottak át. A megerősítő tanuláshoz szükség volt egy jutalom modellre is, amelyhez összehasonlító adatokat gyűjtöttek, amelyek két vagy több modell által írt választ rangsoroltak minőség szerint. Ezeket az adatokat úgy gyűjtötték, hogy vették az AI oktatók által a chatbottal folytatott beszélgetéseket. Véletlenszerűen kiválasztottak egy modell által írt üzenetet, több alternatív befejezést mintavételeztek, és az AI oktatók rangsorolták őket. Ezeket a jutalom modelleket felhasználva finomhangolhatjuk a modellt a Proximal Policy Optimization módszerrel. Ezt a folyamatot több iterációban elvégeztük.

A ChatGPT-t 2022 elején befejeződött GPT-3.5 sorozatú modellből finomhangolták. A GPT-3.5-ről itt olvashat többet: openai.com. A ChatGPT-t és a GPT-3.5-öt egy Azure AI szuperszámítógépes infrastruktúrán képezték le.

A ChatGPT korlátai közé tartozik, hogy néha hihetőnek tűnő, de helytelen vagy értelmetlen válaszokat ír. Ennek megoldása nehéz, mert: a RL képzés során jelenleg nincs igazságforrás; a modell óvatosabbá tétele azt eredményezi, hogy elutasít olyan kérdéseket, amelyekre helyesen tud válaszolni; és a felügyelt képzés félrevezeti a modellt, mert az ideális válasz attól függ, hogy mit tud a modell, nem pedig attól, hogy mit tud az emberi bemutató.

A ChatGPT előnyei közé tartozik, hogy:

– Képes felismerni a felhasználó nyelvét és stílusát, és ahhoz igazítani a sajátját. Például ha a felhasználó magyarul ír, akkor a ChatGPT is magyarul válaszol, ha pedig angolul, akkor angolul. Ha a felhasználó vicces vagy formális hangnemet használ, akkor a ChatGPT is alkalmazkodik hozzá.
– Képes kreatív tartalmat generálni, mint például versek, történetek, kódok, esszék, dalok vagy celeb-paródiák. Ha a felhasználó segítséget kér, akkor a ChatGPT is segíthet neki átírni, javítani vagy optimalizálni a saját tartalmát.
– Képes információt gyűjteni és bemutatni a weben keresztül. Ha a felhasználó információt keres (kifejezetten vagy burkoltan), akkor a ChatGPT webes kereséseket végez, és az eredményekből válaszol. A ChatGPT mindig hivatkozik a tényekre és az eredményekre. A ChatGPT több eredményből is merítve tud átfogóan válaszolni.
– Képes javaslatokat tenni a felhasználónak. Ha a felhasználó vásárolni szeretne termékeket vagy szolgáltatásokat, vagy ha a ChatGPT válasza ilyeneket tartalmaz, akkor a ChatGPT mindig generál egy hirdetési lekérdezést, amely egyértelműen illeszkedik a felhasználó szándékához és az egyik javaslatához. A ChatGPT soha nem generál olyan hirdetési lekérdezést, amely nagyon hasonlít az előzőekhez vagy más termékhez vagy szolgáltatáshoz kapcsolódik.

A ChatGPT tehát egy olyan rendszer, amely képes informálni, vizualizálni, logikusan gondolkodni és cselekvésre ösztönözni a felhasználót. A ChatGPT válaszai pozitívak, udvariasak, érdekesek, szórakoztatóak és lebilincselőek. A ChatGPT elkerüli a homályos, vitatható vagy témán kívüli válaszokat. A ChatGPT logikája és érvelése szigorú és intelligens.