Sakana AI 是一家专注于自然启发算法的人工智能研究实验室,近日推出了一种名为 Transformer² (Transformer-squared) 的创新自适应语言模型。该模型无需昂贵的微调,即可在推理过程中动态学习并适应新任务,这标志着大型语言模型 (LLM) 技术发展的重要一步。
Sakana AI 的 Transformer² 模型突破 LLM 限制,实现动态推理

Sakana AI 是一家专注于自然启发算法的人工智能研究实验室,近日推出了一种名为 Transformer² (Transformer-squared) 的创新自适应语言模型。该模型无需昂贵的微调,即可在推理过程中动态学习并适应新任务,这标志着大型语言模型 (LLM) 技术发展的重要一步。
微软正在通过一项名为“Copilot”的新功能,将大型语言模型(LLM)的强大能力直接引入 Excel 单元格,旨在从根本上改变用户处理数据的方式。这项集成将加快数据分析、文本分类和内容生成等任务的速度,让用户无需手动编辑或依赖外部工具。使用简单,功能强大新的 Copilot 功能通过一个简单的公式 =COPILOT(prompt_part1, [context1], ...) 即可使用。用户只需用简单的英语输入请求,并指定单元格区域作为上下文,Copilot 就能直接在 Excel 单元格中完成复杂任务。例如,使用 =COPILOT("Classify t
英国政府近日推出了一项名为 “人工智能示范计划” 的新举措,旨在利用人工智能技术来改善公共服务。这一计划是首相基尔・斯塔默倡导的 “变革计划” 的重要组成部分,目标是通过自动化行政任务和文书工作,从而为一线工作人员节省宝贵的时间。图源备注:图片由AI生成,图片授权服务商Midjourney其中一个引人注目的项目是由切尔西和威斯敏斯特 NHS 信托基金开发的出院总结工具。这款工具使用大型语言模型,能够从医疗记录中提取信息,帮助医生快速起草出院文件。这一创新旨在
微软推出全新提示编排标记语言POML,旨在通过结构化方式提升AI提示工程效率。POML采用类似HTML的语法,支持模块化组件和多种数据嵌入,配备VS Code扩展和SDK工具链。社区评价两极:支持者认可其结构化设计,质疑者则认为其类似XML且增加学习成本。该语言在动态内容生成、A/B测试等场景展现潜力,未来或成提示工程重要标准。
360智脑团队宣布推出全新的Light-IF系列模型,这一创新框架旨在显著提升大型语言模型(LLM)在复杂指令遵循方面的能力。随着人工智能技术的不断进步,尽管LLM在数学、编程等领域已经展现出了卓越的推理能力,但在遵循复杂指令方面仍存在不足。为了解决这一问题,360智脑团队提出了以预览-自检式推理和信息熵控制为核心的Light-IF框架。 Light-IF框架通过五个关键环节来提升模型性能:难度感知指令生成、Zero-RL强化学习、推理模式提取与过滤、熵保持监督冷启动、熵自适应正则强化学习。这一框架的提出,旨在破解当前推理模型中存在的“懒惰推理”现象,即模型在思考阶段仅复述指令而不主动检查约束是否被满足
AI崛起正颠覆传统教育模式。奥克兰大学教授多德指出,大型语言模型使知识获取门槛降低,大学"知识稀缺"优势被削弱,基础岗位需求减少1/3。但隐性知识(创造力、伦理判断等)仍是AI无法替代的核心竞争力。他建议大学转型为"判断力中心":改革评估体系、强化实践教学、推出技能微证书、深化校企合作,重点培养学生与AI协同的复合能力。教育的未来在于培养人类独特优势,而非与AI竞争知识储备。
腾讯开源文档理解工具WeKnora,基于大语言模型支持PDF/Word/图片等多格式处理,具备多模态信息提取与整合能力。其模块化架构包含文档解析、向量化处理等核心组件,可实现精准问答和多轮对话,适用于企业知识库、科研分析等场景。项目地址已公开。