Изкуственият интелект се подобрява експоненциално на всеки 7 месеца, сочи ново изследване

Последни – AI Bulgaria

Учени от изследователската организация Model Evaluation & Threat Research (METR) установиха своеобразен „Закон на Мур за AI агенти“, според който възможностите на изкуствения интелект да изпълнява самостоятелно все по-дълги задачи се удвояват на всеки седем месеца – тенденция, според която до 2030 г. системите ще могат да автоматизират месеци човешка работа.

В своето изследване, публикувано на 18 март 2025 г., изследователите от METR въвеждат нов подход за измерване на способностите на изкуствения интелект, който те наричат „50%-task-completion time horizon“ (50-процентов хоризонт на успеваемост). „Това е времето, необходимо на човешки експерти да изпълнят задачи, които AI моделите могат да завършат с 50% успеваемост“, обясняват те. „Този показател предлага по-ясна и приложима картина за напредъка на AI от традиционните бенчмаркове, които често не отразяват реалната практическа полза на изкуствения интелект.“

В проучването, анализиращо общо 169 задачи с различна сложност – от съвсем кратки и прости до изключително сложни в области като софтуерно инженерство, машинно обучение и киберсигурност, учените установяват, че „50%-вият времеви хоризонт на AI се е увеличавал експоненциално от 2019 до 2025 г., като съвременните AI системи вече могат да извършват дейности, отнемащи на експерти средно 50 минути“.

Времевата линия, представена в изследването, показва експоненциален растеж – от GPT-2 през 2019 г., способен да изпълнява задачи с продължителност едва няколко секунди, през GPT-4 през 2023 г. с времеви хоризонт от около 8 минути, до Claude 3.7 Sonnet през 2025 г., който успешно се справя със задачи, отнемащи на експертите приблизително един час. „Напредъкът изглежда е основно обусловен от по-голяма надеждност и способност за адаптация към грешки, съчетани с по-добро логическо мислене и използване на инструменти“, отбелязват изследователите.

Модели като Claude 3.7 Sonnet демонстрират около 80% успеваемост при задачи до около 15 минути, но ефективността им спада под 10% при задачи, надвишаващи 4 часа. Изследването идентифицира няколко области, в които AI моделите все още се затрудняват значително. „По-разхвърляните“ (messy) задачи – такива без ясна обратна връзка, с неопределени изисквания или изискващи координация в реално време, представляват по-голямо предизвикателство за AI системите.

Докладът също така разкрива, че разходите за използване на AI модели са значително по-ниски от тези необходими за заплащането на човешки експерти. Над 80% от успешните изпълнения с AI струват по-малко от 10% от цената на човешкия труд, като дори при задачи отнемащи няколко часа AI моделите остават много по-икономични.

При екстраполация на установената тенденция изследователите прогнозират, че „в рамките на следващите пет години ще видим AI агенти, които ще могат самостоятелно да извършват голяма част от софтуерните задачи, които в момента отнемат на хората дни, седмици или дори месеци“. „Стръмността на тенденцията прави нашите прогнози изненадващо устойчиви дори при значителни отклонения в измерванията“, твърдят те. „Грешка от порядъка на 10 пъти би изместила прогнозираните срокове с не повече от две години.“

Изследователите от METR подчертават, че „настоящите експерименти не могат категорично да потвърдят дали наблюдаваните резултати ще се пренесат върху реални задачи, но ако тенденцията се запази, можем да очакваме значителни промени в способността на AI да извършва дългосрочна интелектуална работа“.

Последвайте ни в социалните мрежи – Facebook, Instagram, X и LinkedIn!

Материалът Изкуственият интелект се подобрява експоненциално на всеки 7 месеца, сочи ново изследване е публикуван за пръв път на AI Bulgaria.