back to top
12.5 C
Tirana
E shtunë, 12 Prill, 2025
spot_img
KreuTeknologji / ShkencëShfaqet një “problem i ri” me inteligjencën artificiale

Shfaqet një “problem i ri” me inteligjencën artificiale

Modelet e mëdha gjuhësore (në sajë të cilave ju bisedoni me Gemini ose ChatGPT) kanë filluar të tregojnë disa tipare më pak të dëshirueshme, domethënë “të menduarit shumë” përpara se të përgjigjen.

Modelet e avancuara, si OpenAI o1 ose DeepSeek R1, janë trajnuar për të vënë në dyshim logjikën e tyre dhe për të kontrolluar përgjigjet e tyre.

Megjithatë, nëse ky proces zgjat shumë, cilësia e përgjigjeve të gjeneruara fillon të bie, transmeton Telegrafi.

“Sa më gjatë që ai mendon, aq më shumë ka gjasa që ai të bëjë një gabim sepse ngec”, tha për Business Insider, Jared Quincy Davis, themeluesi dhe CEO i Foundry.

Ai e krahasoi atë me një student që shpenzon tre orë në një provim duke punuar vetëm për pyetjen e parë, duke u ngecur në një rreth vicioz të “mendimit të tepërt”.

Davis, së bashku me studiues nga Nvidia, Google, IBM, MIT, Stanford, DataBricks dhe të tjerë, prezantuan një kornizë me burim të hapur të quajtur Ember, i cili besohet se paralajmëron fazën tjetër të zhvillimit të modeleve të mëdha gjuhësore.

Ka nga ata që mendojnë ndryshe – kohët e fundit ekspertët, përfshirë Jensen Hwang, theksuan se modelet që kërkojnë më shumë kohë për një përgjigje më të qëllimshme do të përfaqësojnë të ardhmen e përmirësimit të performancës.

Megjithatë, ekipi i Ember organizon të gjithë strukturën rreth një koncepti me të cilin Davis dhe studiues të tjerë të AI kanë eksperimentuar me muaj – vetë Davis, nëntë muaj më parë, përshkroi metodën e tij për të “ftuar” ChatGPT 4 për t’iu përgjigjur të njëjtës pyetje shumë herë dhe për të zgjedhur përgjigjen më të mirë.

Tani, studiuesit Ember po avancojnë këtë metodë, duke imagjinuar sisteme komplekse në të cilat çdo pyetje ose detyrë do të kërkonte një rrjet modelesh të ndryshme, me kohë të ndryshme “të menduarit” të optimizuara për secilin model dhe çdo pyetje.

Ndërsa njerëzit që mendojnë tepër këshillohen t’i zbërthejnë problemet në pjesë më të vogla, Ember niset nga një teori e ngjashme, por këtu përfundon ngjashmëria.

Aktualisht, përdoruesit zgjedhin një model (p.sh. ChatGPT 4) nëpërmjet një menyje rënëse. Davis beson se kjo nuk do të zgjasë shumë ndërsa kompanitë e AI përpiqen për rezultate më të mira duke përdorur strategji më komplekse për të drejtuar pyetjet përmes modeleve të ndryshme me numra dhe kohëzgjatje të ndryshme.

Davis shpjegon se në vend të një milion telefonatash, mund të jenë triliona ose kadriliona telefonata dhe se do të jetë e nevojshme të renditen këto thirrje dhe të zgjidhen modelet dhe pyetjet e duhura për secilën prej tyre (p.sh. GPT 4, GPT 3, Anthropic, Gemini, DeepSeek).

Kjo përfaqëson të menduarit në më shumë dimensione sesa “pyetjet dhe përgjigjet” e thjeshta që ne njohim, dhe do të jetë veçanërisht e rëndësishme në epokën e agjentëve të AI që kryejnë detyra pa ndërhyrje njerëzore.

Davis i krahasoi këto sisteme komplekse të AI me inxhinierinë kimike, duke theksuar se është një shkencë e re.

spot_img
ARTIKUJ TË NGJASHËM
- Advertisment -spot_img

Më të Lexuarat