Chuangzhi的突破:AI首次,106神经网络建筑是超出人
发布时间:2025-07-29 08:37
发现科学仍然是人类专利吗?尽管世界在数学比赛中的AI金牌水平仍然令人震惊,但更深入的成功正在悄悄地发生。与解决诸如IMO问题之类的封闭问题不同,科学的真正发现是一个开放且长期的培养过程 - 它需要增加原始问题,设计实验计划,观察异常法律,构成科学假设,然后通过继续测试和犯错而实现真理。该过程的复杂性比任何标准测试都要多。它不需要计算力量,而是真正的科学和现代思维。一个研究团队发布的超级智能AI系统现在是Chuangzhi Academy的Pamumumunuan,现在被证明是AI第一次能够完成科学发现的能力 - 该系统发现了106个神经网络建筑,超越了人类的设计,超越了人类的设计(转移强大的Baseli Baseli Baseli baseli baseli baseliNE模型,例如Mamba2和Gated Deltanet,达到许多基准)。更令人恐惧的是,起初已经证明,科学的突破可以是工业化和大规模制造的培训模型。可以明显地表明,我们已经正式进入了一个长期自主性超智能的新时代,科学发现进入了扩大法律的时间!从数学金牌到科学家发现:认知的复杂性,在AI领域最引人注目的成就之一是数学竞赛中的突破。诸如Google之类的研究团队已经表明了AI系统在国际数学奥运会(IMO)等比赛中达到金牌水平的能力,这无疑是AI推理能力的重要里程碑。但是,在解决数学竞争问题和进行科学发现方面,认知的复杂性存在重要差异。虽然数学比赛是差异知识,这些都是重要的精神问题:问题的界限是明确的,判断标准是客观的,并且路径解决路径很复杂,但相对具体。 AI系统主要需要在有限的问题空间内进行深入识别和计算。但是科学的发现具有不同的吸引力。这是一个开放的长期认知过程,其中包含人类智慧的最高形式。长期以来,科学的发现被认为是人民独有的,并且依靠研究人员和直观观点的创造性思维。特别是在人工智能领域,神经网络架构的设计被认为是一种先进的智力活动,需要深入了解专业和创新思维。由上海Chuangzhi学院主持的团队发布了超级智能AI系统:ASI-Arch,其成功的设计完全降低了这种看法。基于高级技术该系统的大规模模型的Ology生成了高度自主的多重研究研究框架,该框架可以完全独立地从事问题,假设产生,实验设计的完整科学研究过程,从而导致验证。纸张标题:模型架构发现系统的Alphago瞬间开源:https://github.com/gair-nlp/asiarch网站地址:https://gair-nlp.github.io/asi-arch/在独立研究的几个月过程中,ASI-ARCH系统表现出了令人印象深刻的研究能力。该系统总共进行了1,773个独立实验,消耗了超过20,000个GPU小时的计算资源。没有人类干预,ASI-Arch独立地发现了106本小说和出色的关注体系结构,超过了许多基准的强大基线模型,例如Mamba2和Gated Damanet。这项研究的规模和效率不仅仅是传统人类研究团队的能力。图:AI能够团结1,773次科学探索。更重要的是研究质量。该系统没有进行盲目的随机搜索,而是与领先的科学家展示了类似的研究直觉和逻辑推理技能。根据先前的结果明智地迭代了每个实验,显示了科学思维的真实思维过程。这一突破意味着科学研究正在从“计算机驱动”模型中的传统模型“以人为驱动”的形式转变,从而为加速科学发现开辟了新的途径。突破性结果:106个创新建筑以外的人类。 ASI-ARCH系统成功地发现了106个注意机制机理的新架构,每个结构都显着地介绍了现有的人类设计解决方案的性能指标。这些发现的重要性不仅在于提高性能,而且在设计概念的变化中也有所改变。建筑设计的许多原理和系统的技术原理该系统建议的问题已经承认,他们以前从未考虑过。它表明,AI系统比人类认知理解的界限能够改变更多。正如Go World中的“ 37时刻”显示出AI的超人战略情报一样,ASI-Arch Discovery也证明了AI在现代科学领域的超人潜力。为什么这是AI Architecture设计的“ Alphago时刻”?传统的神经体系结构搜索(NAS)技术基本上是由人们在大型预先批准的空间中组合和选择的,扮演“高级优化器”的帕普尔,其创造力是有限的开始。 ASI-ARCH取得了合格的跳跃。这代表了从“自动化 - 爆发”到“自动化变化”的范式转变。通过认知和大型编码的强大能力,ASI-Arch不再限于现有模块,而是可能提出新的假设,例如人类科学家:最终会怀孕不间断的建筑概念。实施和验证:在代码中写下这些新想法,并通过严格的实验来验证其有效性。不仅仅是人类停车:发现现有的人类设计和直觉游行之外的新建筑。本文从“工具”转变为“研究合作伙伴”甚至“独立MGA研究员”,这是为什么它被称为AI架构设计领域的“ alphago时刻”的主要原因。它标志着AI进入了以前既有能力的科学的更具创造性的进程。 - 这项研究的革命性贡献是“发现科学的扩展法”的第一个建立。人类的研究人员,并且有明确的瓶颈。“密集型计算机”,为人类科学世界的主要挑战提供了新的解决方案。稍微探索了新的建筑师已经定义了与以前的架构代码的新体系结构的关系。由四个MGA模块组成的系统:“研究人员”,“工程师”,“分析师”和“认知库”。研究人员:作为系统的“大脑”,他负责提出创新的建筑思想并制定新的建筑法规。它从人类的历史经验和知识中受到启发,以产生新的设计动机。工程师:作为“动手”,他负责接受“研究人员”建筑法规,培训和审查真正的培训环境。分析师:扮演“反射器”的作用,该作用全面研究了实验数据,总结了成功和挫败感的原因,这些观点远非新知识,并将其送回“研究人员”以指导下一次革命。认知基础:李它是“图书馆”,它存储了从泰尔(Taor)的近一百张高级论文中获得的基础知识,该论文提供了人类专家的“认知”支持。尤其关键的是,该图引入了创新的健身函数,该功能不仅评估了模型性能指标(例如损失和基准分数),而且还引入了LLM“专家审查”以有效评估变化,复杂性和其他设计。这种设计将有效地防止毫无意义的设计中的“奖励黑客”问题,以确保输出体系结构既强大又高质量。照片:对ASI-Arch架构实验结果的解释:AI“研究人员”全面超越了人类的领先模型,最终证明了AI“研究人员”设计建筑的真实能力,我们在AI和领先的人类智慧之间进行了“峰值摊牌”。该研究的Ang Pathe研究创造了对AI自动盘的严格和公正的积极比较RY建筑具有公认的基线行业(例如Deltanet),它代表了最先进的线性关注水平。该实验对两个阶段采用了科学而出色的“探索验证”方法:1。勘探阶段(20m参数序列):在此阶段,ASI-Arch对较小的模型量表进行了大规模的“研究”,旨在快速筛选候选人的潜在体系结构。令人惊讶的是,即使在该资源强迫的探索阶段,大多数AI的体系结构在关键指标中表现出强大的强度,这为真正成功的稳固的基础提供了坚实的基础。 2。验证阶段(340m时序列参数):使用勘探阶段的高电位结构具有更大的模型量表,以“最终验证”。在更接近现实应用程序方案的规模中,AI体系结构的潜力已完全发布,并且出色rmance已被充分确认。实验结果表明,我们在12个不同的基准测试中全面回顾了该模型的性能,这些基准涵盖了通常的愤怒和对阅读的理解。 AI自主发现的体系结构(用白色背景确定)完全超过了线性注意力基线,例如封闭式的平均得分,在该领域的上限(SOTA)中成功调节性能。表:各种体系结构与语言和零样本模型Swhich的性能的比较是常见的推理。这个出色的成绩单显示了ASI-Arch的一些关键特征:1。更强大的全面力量,拒绝偏见主题:最终成功并不取决于单个活动中的“偏见才能”,而是衡量模型全面智慧的平均模型的全面领导。这意味着AI检测体系结构在不同的滑雪中表现出出色而平衡的性能诸如普通推理(例如PIQA,HELLASWAG),知识和回答问题(例如Arc-Hamon,OpenBookQa),阅读理解(例如小队)以及更稳定,更普遍的智慧表现之类的LLS。 2。更高的学习效率和更稳定的基础:在研究效率和基本语言建模能力中,在训练损失(损失)和混乱(PPL)指标方面,ASI-Arch发现的主要体系结构通常达到了较低的价值。这意味着AI的架构在研究方面更好,可以通过相同的数据进行更多的知识,并且对语言政策有更准确的了解。 3。这一发现是普遍的,偶然的:这种成功并不是单一“天才模型”的偶然爆发,而是集体发生的106种新的SOTA架构。这完美地表明,ASI-Arch发现功能是系统的,可以复制。寻找它,我们到达并不是一个重点,而是一个富裕而新的“ Struc简而言之。这些技术在没有人类知识的指导下实现了更好的动态分配,从而在全面的绩效指标中取得了完整的成功。rch team divided the models into two groups: 106 models with best performance (SOTA) and the remaining general performance models, and discovered design and wisdom patterns similar to human scientists who appeared in the AI design process "Researchers": (1) become down-to-earth and focus on classics is not blind chased "by the novel", but working works are not a good way of working: in conjunction with the leading human scientists: innovative changes in mature and proven技术。通过检查所有AI探索的架构的组件,我们可以看到AI显然更喜欢使用经典和功能强大的组件,例如“门控系统”和“卷积式体系结构”。尽管还探讨了AI的大量小说“长尾部”成分,例如“受物理启发”的“物理学”,但关键区别在于,106个最佳性能模型(画廊模型)的“长尾巴分布”比其他模型较差。它表明领先的AI设计将转换为基本和EF通过独特的组合和改进这些基本技术,而不是漫无目的地追逐新颖性,可以充分收集通过独特的组合和改进来实现突破的技术。 (2)从经验中学习并在评论中扭转:AI的灵感在哪里改变了?研究表明了一个深刻的模型:为了达到“效率”,AI可能依靠研究以前的人类知识(理解);但是,为了实现“效率”和真正的突破,对自己的实验历史记录的深度分析和抽象摘要很重要。通过监视设计的资源灵感,可以发现,对于所有模型,它们的灵感主要是从参考人类纸张知识中得出的(“认知”占51.7%)。但是,对于顶级模型组而言,它们的设计是先前“体验”实验比例(44.8%)的自我逆转灵感(44.8%)高于其余模型(37.7%)。这证明,在研究人类经验的同时主要是合成否的能力通过自我探索,摘要和发现干扰AI结果的关键,VEL解决方案。 。但是,ASI-ARCR显示了一种自然的“设计学科”,该纪律拒绝了这种简单的方法,即通过剧烈的复杂性来提高性能。尽管AI在实验的第一阶段探索了各种尺寸的模型,但是在整个进化过程中,AI设计的AI参数的分布一直保持稳定,并且没有持续的增长。大多数模型在特定参数范围内稳定。它表明,ASI-Arch在相当公平的“复杂预算”下进行了真正的“明智思维”,并且正在寻找更好,更智能的建筑设计,而不是依靠“堆积”。开放资源贡献:促进民主党ASI-Arch在AI中促进全球研究方面的成功表明,正式开放了新的“ AI研究AI研究”时期(ASI4AI)。这个概念描述了AI系统可以独立成为Mado的发展阶段科学研究,设计和优化下一代AI系统。在这个新时代,AI不再只是一种研究工具,而是一个真正的研究主题。 AI系统设计更强大的AI系统来产生积极的自我完善循环,这将大大加快整个AI领域的开发过程。为了促进全球AI研究的协调发展,研究团队做出了战略决策:打开所有106个突破性架构的资源,ASI-ARCH系统的完整框架以及全球研究研究过程的详细数据。这种开放资源将具有广泛而遥远的效果。全球研究人员可以直接从AI自主发现中受益,并在此基础上进行Aadditional创新研究。同时,ASI-Arch框架的开源将为开发更自主的AI研究系统提供重要参考。图:AI发现新弓的详细描述ITECTER(https://gair-birp.github.io/asiark/)重新定义ASI-Arch科学研究的未来不仅是技术的成功,而且是认知革命。这证明了机器可以真正思考科学,而不仅仅是数据处理或模式匹配。它为解决人类面临的关键挑战打开了新的可能性。从气候变化到疾病治疗,从开发新材料到主要的物理理论,长期自主智能Sistheme有望在这些领域发现突破。尽管科学的发现正在参加法律时期,但我们站在前所未有的人类文明历史上。随着时间的流逝,ASI-Arch是自治智力的长期先驱,其历史重要性将成为越来越多的知名人士。我们不仅目睹了AI从工具转变为伙伴的转变,而且还目睹了历史跳跃神父在人机合作中探索的人类非水作用。这是一场代际革命提供的能力,也是加速人类文明发展的新起点。
购买咨询电话
400-123-4567