相关推荐
字节开源全新代码大模型评估基准“FullStack Bench”
12月5日,字节豆包大模型团队推出了最新的代码大模型评估基准——FullStack Bench,涵盖了超11类真实场景,支持16种编程语言,并包含3374个问题。这一基准相比之前的评估标准,在更广泛的编程领域中能更准确地评估大模型的代码开发能力,推动了模型在现实世界编程任务中的优化。目前的主流代码评估基准,如HumanEval和MBPP,通常集中在基础和高级编程问题,而DS-1000则专注于数据分析和机器学习任务,且仅支持Python。xCodeEval则侧重于高级编程和数学领域,存在较大的应用场景和语言覆盖限
2024年12月5号 14:45
223.8k
DeepSeek 发布开源代码大模型 DeepSeek Coder
["DeepSeek(深度求索)发布了开源代码大模型 DeepSeek Coder","DeepSeek Coder 是一个智能代码助手,可以生成各种代码","DeepSeek Coder 已经在 Hugging Face 和 GitHub 上开源","DeepSeek Coder 在国际权威数据集的测试中表现出色","DeepSeek 致力于探索 AGI 的本质,将推出更多研究成果"]
2023年11月6号 9:31
259.4k
马斯克前女友起诉xAI:指控Grok生成不当图像
马斯克前女友起诉其AI公司xAI,指控聊天机器人Grok未经同意生成并传播其色情图像,引发AI伦理争议。
2026年1月16号 8:59
24.6k
OpenAI 巨额投资脑机接口初创公司 Merge Labs,布局“人机融合”
OpenAI CEO参与创立的脑机接口公司Merge Labs完成2.5亿美元种子轮融资,估值达8.5亿美元,OpenAI领投。与Neuralink手术植入方案不同,该公司采用非侵入式技术路线,致力于连接生物智能与人工智能。
2026年1月16号 8:55
24.6k
效率狂飙90%!默多克联手 Symbolic.ai,新闻集团开启 AI 采编新纪元
新闻集团与Symbolic.ai合作,将AI深度融入核心新闻生产,道琼斯通讯社率先应用,旨在提升财经报道效率与质量。
2026年1月16号 8:55
114.1k
