智源研究院发布代码生成训练数据集 TACO

维基百科近日宣布,将通过与谷歌旗下的数据科学社区平台 Kaggle 的合作,发布一份专门优化用于人工智能模型训练的数据集。这一举措旨在减少 AI 开发者通过爬虫程序抓取维基百科数据的行为,保护平台的带宽和服务器资源。该数据集的内容包括英语和法语的结构化维基百科信息,具有良好的机器可读性,便于 AI 开发者进行建模、微调和数据分析。维基媒体基金会表示,这份数据集以开放许可的方式发布,内容涵盖了研究摘要、简短描述、图像链接、信息框数据以及文章的各个部分,但
彭博社率先报道,OpenAI 正与人工智能辅助编程工具 Windsurf(前身为 Codeium)展开收购谈判,交易金额约为30亿美元。这一潜在收购将成为 OpenAI 迄今为止最大规模的并购交易,标志着其在 AI 驱动的开发者工具市场迈出重要一步。Windsurf:AI 编程领域的明星工具Windsurf 是一款广受开发者欢迎的 AI 编程助手,能够基于自然语言提示生成代码、解释现有代码并执行相关任务。它不仅支持通过插件嵌入主流代码编辑器(如 Visual Studio Code),还提供专为 AI 辅助开发设计的自定义编辑器。Windsurf 自称是
在人工智能的浪潮下,Salesforce 最近透露,其内部工具 Agentforce 已经为20% 的 APEX 代码生成做出了贡献。这一消息引发了业内对开发者未来角色的广泛讨论。与一些专家预测的 “程序员将被取代” 形成鲜明对比,Salesforce 的开发者们正在进化为更具战略性的角色。图源备注:图片由AI生成,图片授权服务商Midjourney开发者角色的转变Salesforce 的人工智能高级副总裁贾耶什・戈文达拉詹(Jayesh Govindarajan)指出,尽管 AI 能够编写大量的代码,但开发者的工作方式已经发生了根本变化。“开发者不
近日,AI代码生成领域掀起了一波开源热潮,多款重量级模型接连亮相,其中Deep Cogito推出的Cogito v1Preview系列尤为引人注目。据AIbase了解,这一全新开源模型家族涵盖3B、8B、14B、32B和70B等多种规格,不仅在性能上全面超越同级别竞争者,其70B版本更是力压Meta最新发布的Llama4109B MoE模型,成为业界热议的焦点。这一系列模型的发布,不仅为开发者提供了强大的编程利器,也预示着AI技术在编码领域的全新突破。多规格覆盖,性能领跑行业Cogito v1Preview系列提供了从3亿到70亿参数的多种选择,满
据国外媒体消息,微软首席技术官凯文斯科特 (Kevin Scott) 作出大胆预测,到2030年,高达95% 的编程代码将由人工智能生成。不过,他紧接着进行了澄清,这并不代表人类参与软件工程的终结。斯科特解释道,“这并不意味着人工智能正在做软件工程工作,作者仍将是人类。它创造了另一个抽象层,因为我们从输入大师(编程语言)变成了提示大师(人工智能协调者)。” 他认为人工智能不会取代开发人员,而是会从根本上改变他们的工作流程。未来,工程师们将越来越依赖人工智能工具。
腾讯元宝宣布其最新版V3正式上线,带来了令人瞩目的功能升级。此次更新的核心亮点在于元宝接入了混元T1正式版和DeepSeek V3-0324两大先进模型,这使得元宝在代码生成、结构理解以及语言响应等方面的能力得到了显著提升。用户只需简单地描述需求