最近的一项综合基准评估对 Web3 领域当前的人工智能能力进行了发人深省的评估,发现即使是领先的人工智能模型也难以可靠地执行区块链最关键的功能。
这项研究由一个独立研究联盟进行,测试了跨基本区块链用例的多种最先进的语言和推理模型,包括智能合约审计、交易异常检测、去中心化治理模拟和加密协议验证。
“理论潜力和实际效用之间的差距仍然很大,”该研究的首席研究员埃琳娜万斯博士表示。 “虽然模型表现出对区块链概念的会话熟悉度,但当在 Web3 环境中执行精确的技术执行、安全分析或解决新问题时,它们的性能会显着下降。”
主要调查结果表明,在一致性、安全关键推理以及适应快速发展的去中心化网络条件方面存在特殊缺陷。该基准建立了一个急需的标准化框架,用于评估 Web3 环境中的人工智能,超越轶事证据,转向定量性能指标。
行业观察家指出,这些结果既为立即部署预期提供了警示,又为重点开发提供了明确的路线图。 “这个基准设定了一个基线,”Web3 开发人员 Marcus Thorne 评论道。 “它展示了我们需要在哪里构建专门的训练数据集、混合系统和全新的方法,以使人工智能真正适合去中心化技术。”
完整的基准测试方法和逐个模型的结果已公开,以加速人工智能和区块链开发社区的协作改进。
