AI编程智能体的能力增长速度极快,最新研究揭示了这一“新摩尔定律”,若AI智能体的任务时长持续以每4个月翻倍的速度增长,到2027年它们有可能完成长达167小时的月级任务!
编程智能体能完成的任务量,正以爆炸式的速度增长!
而且,这一趋势还在加速。
2024年到2025年期间,它们的任务处理能力每隔4个月就会实现翻倍,在2019年到2025年这个时间段,翻倍周期为7个月。
22号,AI研究网站AI Digest发表了上述观点,该观点揭示了一个新的定律,此定律是关于AI智能体的摩尔定律 。
博客地址:
从图表中能够清晰看到这一趋势,任务时长呈现出增长态势,其增长轨迹几乎是一条陡峭的指数曲线。
2019年,GPT - 2仅能处理简单任务,且处理时间不到1秒;2022年GPT发布时,AI已能够完成编程任务,完成时间为30秒。
现在,智能体可以自主完成人类需要一小时才能完成的编程任务。
顶尖的AI系统能够完成的任务长度,正呈现出指数级增长的态势,其增长速度为每7个月就会翻一番 。
这个趋势是METR的研究人员发现的。
他们挑选出2019年到2025年期间最强的AI模型,对这些模型在大约200个任务上的表现进行测试,这些任务主要是编程任务,还包括一些逻辑推理任务。
然后,他们对AI的成功率与每个任务的长度进行了对比,任务长度指的是专业人士完成这些任务所需的时间,其时长从不到30秒到超过8小时不等。
测试过所有模型后,出现了两个明显的规律:
接下来是什么?
这个指数增长的趋势看起来很稳健,没有停下来的意思。
如果按照这个趋势推算下去,AI智能体将能够完成:
2026年:2小时的任务;
2027年:1个工作日(8小时)的任务;
2028年:1个工作周(40小时)的任务;
2029年:1个工作月(167小时)的任务。
最近,这一趋势还在加速。
2024年到2025年期间,时间跨度呈现出一种规律,即每4个月任务长度就会翻一番。而在2019年到2025年期间,情况有所不同,是每7个月任务长度翻一番。
按照2024 - 2025年加速的趋势进行推算,这种趋势是每4个月翻倍,据此推测,AI智能体有可能在2027年完成月级任务,该任务时长为167小时。
然而,只观察一年的数据来给出预测,可能会不太稳定,实际的进步速度,也有可能会放缓。
不过,考虑到这个趋势已经开始加速,它很可能处在一个增长轨道上,这个增长轨道比指数增长还要快 。
这也十分符合直觉,随着增长轨道呈直线上升,1周任务和2周任务之间所需技能存在差距,这种差距可能比1年任务和2年任务之间的差距更大。
此外,随着AI能力不断提升,它们在开发更强大AI这件事上的作用会变得越来越大,这种情况可能会导致超指数级增长。
智能爆炸
AI智能体能力得到提升,这会反过来加速更强大AI的研发,进而形成飞轮效应,即更强大的AI智能体能够更快地开发出更先进的AI系统,最终进一步提升能力。
这种正反馈循环有可能致使超指数增长,甚至引发「软件智能爆炸」,也就是说AI能力会在短时间内急剧提高,大幅超越人类的水准 。
此外,算法进步也在推动这一趋势。
METR的研究显示,近些年来AI在算法效率方面有了提升,这种提升明显降低了计算资源的需求。
采用更高效的预训练方法,再结合更高效的后训练方法,即便硬件资源没有增加,AI智能体的能力也能够快速得到提升。
AI智能体任务时长呈现指数增长,这有可能成为人类历史上极具变革性的趋势之一 。
它能够在短时间之内完成复杂的任务,这将会对软件开发领域产生彻底的改变,也会对科学研究领域带来彻底的改变,还会对医疗诊断领域造成彻底的改变 。
一个AI智能体,它能够自主完成月级任务,可以完全自动化软件工程项目,甚至能独立进行科学研究,进而大幅提高生产效率。
这一趋势带来了潜在的社会挑战,AI智能体能力快速提升,人类社会可能难以适应这种变化。
许多传统职业或许会面临自动化,人类或许得转向更具创造性的角色,人类或许得转向更具策略性的角色。
参考资料:
本文源自微信公众号“新智元”,作者是新智元,由36氪经授权后进行发布。
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://www.mjgaz.cn/fenxiang/275754.html