最新的 AI 行业动态与技术新闻
原标题: 《Show HN: Auto-Architecture: Karpathy's Loop, Pointed at a CPU》 评分: 26 | 作者: fesens 💭 把规则写死,AI 就不会偷偷钻空子了吗? 🎯 讨论背景 这条 Show HN 展示的是一个把 Karpathy's Loop(Karpathy 提出的 LLM 自动研究/优化循环)直接用在 CPU 架构上的实验思路...
随着人工智能技术进入大规模应用期,如何提升数据要素的配置效率成为行业关注命题。4月28日,蚂蚁数科在第九届数字中国建设峰会上正式发布DataX智能体数据生态平台,通过接入模型上下文协议(MCP)和专业智能体 DTClaw ,降低数据接入门槛,缩短数据价值转化周期。 传统模式下,数据从“原材料”到业务应用普遍存在集成周期长、理解难度大、跨平台应用适配难等痛点。DataX 技术底层将传统数据服务转变为...
英伟达发布了其开放式多模态模型 “Nemotron 3 Nano Omni”,这款新模型将视频、音频、图像和文本的推理能力整合到一个系统中,旨在为用户提供更快速和智能的响应。根据英伟达的介绍,这款模型采用了先进的 30B-A3B 混合专家架构,集成了视觉与音频编码器,无需依赖额外的感知模型,因此在大规模推理效率上显著提升。 [图片: 英伟达 https://pic.chinaz.com/picma...
蚂蚁集团旗下的百灵大模型今日宣布,正式开源其 最新 成员Ling-2.6-flash。该模型同步推出了BF16、FP8、INT4 等多个量化版本,旨在为全球开发者提供更灵活的硬件适配选择,进一步降低AI部署的门槛。 作为一款高性能模型,Ling-2.6-flash的总参数量达104B,其中激活参数为7.4B。此前,该模型曾以匿名身份在国际主流评测平台崭露头角,并根据开发者反馈完成了多轮针对中英文切...
4月29日,腾讯旗下的智能工作台ima宣布正式推出个人知识 Agent——copilot。该产品旨在通过深度个性化记忆与全场景感知能力,将原有的 AI 搜索工具升级为具备持续进化能力的个人知识伙伴,标志着 AI 应用从单次对话工具向长效智能体的关键转型。 [图片: QQ20260429-112700.jpg https://upload.chinaz.com/2026/0429/639130590...
大模型是否注定只能是高效的“搜索引擎”?在深圳忆纪元科技有限公司(MemoraX AI)创始人郝建邺看来,如果无法跨越从“存储”到“记忆”的鸿沟,AI将永远无法成为真正的智能伙伴。 近日,这家成立仅一个月的初创公司宣布完成千万美元种子轮融资。本轮融资由L2F光源创业者基金、钟鼎资本联合领投,知名投资人及产业方共同参与。据悉,这笔资金将核心用于Agentic RL(智能体强化学习)算法的迭代、工程化...
原标题: 《ChatGPT serves ads. Here's the full attribution loop》 评分: 183 | 作者: lmbbuchodi 💭 不是说最后手段吗,怎么这么快就上广告了? 🎯 讨论背景 这条讨论围绕 OpenAI(人工智能公司)给 ChatGPT(对话式 AI 产品)在 free tier 和新的 $8 Go plan(低价订阅档)里加入 ads(广...
4月29日,机器人租赁与服务平台擎天租宣布完成数亿元 Pre-A 轮融资。本轮融资集结了正大机器人、长信股份等产业资本,以及美格智能、蓝思科技等多家上市公司,老股东明嘉资本、知行投资和睿资创投亦进行了超额认购。资金将重点投向全国履约服务网点建设、机器人资产调度系统升级及全球化服务网络拓展。 截至4月中旬,擎天租平台已接入并可调度的机器人规模突破4000台,服务网络覆盖全国百余座城市。随着具身智能技...
当前,大模型的竞争焦点已从单纯的模型性能比拼,转向如何以更低成本、更高效率,在企业真实场景中实现规模化应用。如何更懂企业,更适配企业的需求,成为行业关注重点。 4月29日,蚂蚁数科宣布推出Ling-2.6-flash商业版LingDT-2.6-flash。该模型主打“Token效率”,在同等测评任务下相比同参数级别模型可节省90%Token消耗,更快、更省、更适合企业真实场景大规模部署。 据悉,L...
原标题: 《We decreased our LLM costs with Opus》 评分: 26 | 作者: shad42 💭 先用便宜模型做判断,再宣布是 Opus 把成本降了? 🎯 讨论背景 这篇讨论围绕一篇工程博客:团队在工单/问题排查流程里,用 Anthropic(Claude 系列模型的厂商)的 Haiku(较便宜的小模型)先做 triage,再把少量复杂 case 升级到 Op...
AI 编程领域的成本压力正进一步显现。近日,知名人工智能公司 Anthropic 在未发布正式公告的情况下,对其 AI 编程工具 Claude Code 的计费标准进行了大幅调整。根据官网 最新 披露的数据,该工具的 Token 消耗成本已较此前预估水平直接翻倍。 在 最新 的企业部署说明中,Anthropic 指出,目前每位开发者在活跃日的平均使用成本约为13美元。而在此前(4月16日之前)的官...
吨级重载新纪元开启|大咖机器人全球首发“吨级重载机器马” [图片: http://www.qbitai.com/wp-content/uploads/2019/06/200-100x100.jpg] 量子位的朋友们 2026-04-29 11:06:21 来源: 量子位 覆盖安防巡检、消防救援、工程基建、智能物流、民生养老、个人出行等六大核心场景 在国家 人工智能 + 行动 深入实施、具身智能产业...
随着GPT- 5 正式步入应用阶段,OpenAI在全球互联网上的数据采集力度达到了前所未有的高度。 最新 行业监测数据显示,自 2025 年 8 月新一代模型发布以来,OpenAI旗下爬虫程序的活跃度激增了约300%,显示出其对实时信息与高质量训练数据的极度饥渴。 [图片: OpenAI,人工智能,AI https://pic.chinaz.com/picmap/20240511093333004...
蚂蚁集团旗下的百灵大模型系列于今日迎来重要更新,Ling-2.6-flash正式向全球开发者开放。为了适配差异化的硬件环境并降低部署门槛,该模型同步推出了 BF16、FP8以及 INT4等多个精度版本,旨在为开发者提供更具弹性的推理选择。 作为一款总参数量达到104B、激活参数量为7.4B 的 Instruct 模型,Ling-2.6-flash在正式官宣前,曾以“Elephant Alpha”的...
国产大模型领域的“军备竞赛”再次升级。据 最新 消息,月之暗面旗下的下一代主力模型 Kimi K3 预计将在今年第三季度正式发布。作为备受瞩目的后起之秀,Kimi 系列的每一次迭代都牵动着行业神经,而 K3 的亮相无疑将进一步拉高国产大模型的竞争门槛。 2.5 万亿参数规模直指行业 天花板 在核心技术指标上,Kimi K3 展现出了惊人的跨越式增长。其参数规模有望达到 2.5 万亿,这一数据在目前...
2026年4月28日,来自伦敦帝国理工学院、互联网档案馆及斯坦福大学的研究人员发布联合研究报告指出,AI 生成文本已深度渗透全球网络生态。数据显示,截至2025年中期,全球约35% 的新发布网站内容全部或部分由 AI 生成,而这一数字在2022年底 ChatGPT 发布前几乎为零。研究团队通过对2022年至2025年间33个月的网页样本进行大规模分析,证实了 AI 对互联网话语体系带来的实质性改变...
4月28日,Mistral AI宣布推出其企业级 AI 编排层Workflows。作为Mistral Studio平台的关键组成部分,该工具旨在协助企业将零散的 AI 驱动流程转化为可大规模投入生产的系统。目前,Workflows已进入公开预览阶段,吸引了包括ASML、ABANCA及CMA-CGM在内的多家跨国巨头将其应用于核心业务流程。 在技术架构上,Workflows基于高性能Temporal...
在经过长达 12 小时的谈判后,欧盟各国代表和欧洲议会立法者未能就即将出台的人工智能(AI)法规达成一致。这项法规被认为是全球最严格的人工智能监管措施之一,旨在应对该技术对社会和经济带来的潜在风险。此次谈判于 4 月 29 日举行,虽然各方都认识到推动法规的重要性,但最终仍然因分歧而未能达成协议。 [图片: AI,人工智能 https://pic.chinaz.com/picmap/2024122...
前推特首席执行官 Parag Agrawal 创办的初创公司 Parallel Web Systems 近日成功完成了一轮 1 亿美元的 B 轮融资,使公司的估值飙升至 20 亿美元。 这轮融资由 著名 风险投资公司 Sequoia Capital 领投,现有投资者 Kleiner Perkins、Index Ventures 和 Khosla Ventures 也参与其中。目前,Parallel...
银河通用LDA定义全域数据利用范式,跨本体世界动作大模型开启具身GPT-2时刻 [图片: http://www.qbitai.com/wp-content/themes/liangziwei/imagesnew/head.jpg] Jay 2026-04-29 10:23:06 来源: 量子位 开启具身规模化时代 衡宇 Jay 发自 凹非寺 量子位 | 公众号 QbitAI 当下的具身智能赛道,已...
社交媒体上的 AI 讨论热点
小米Token计划遭遇了一个令人困惑的bug:用户在邮箱中收到审核通过的通知,但当他们尝试登录官网时,系统却显示该邮箱账户不存在。此问题导致用户无法正常访问或使用Token计划。
博主LysonOber表示,由于每天与AI共同学习导致用脑过多,他决定重新开始服用磷脂酰丝氨酸(PS)。他高中时曾尝试过,个人感觉效果不错。此为个人经验分享,不构成医疗建议。
OrangeCLK指出,几乎所有公司都承认与Opus存在差距,但舆论似乎只关注DeepSeek对此的承认。这引发了对媒体和公众关注点选择性的思考。
姚金刚老师和张凯基于大量数据研究,完成了关于GEO(地缘政治)的专项论文,并在全球最大论文平台arXiv.org正式发布。该报告利用科学方法分析,就像用数据洞察商业增长一样,提供了第一手实战经验和最新的数据分析。
Hi everyone, The 2nd Multilingual Conversational Speech Language Models Challenge 2026 is now open for registration. This year’s challenge focuses on Speech LLMs for real-world multilingual conversati...
Ghostty负责人,一位拥有5万多GitHub粉丝的重度用户,表示因GitHub频繁故障和不稳定,已严重影响开发工作。他计划将核心开发迁移至自建服务,GitHub仅保留代码库。他认为在AI时代,GitHub作为Vibe Coding基础设施,其稳定性问题是巨大隐患。
OpenAI联合创始人Greg Brockman分享了一个关于Codex的精彩教程,题为“Riley Brown: Learn 95% of Codex in 28 minutes”。该教程详细介绍了Codex的7项核心知识工作能力,包括文件访问、持久记忆、插件、技能等。
Sam Altman分享了一张图片,但未提供具体文字内容和背景信息。
Tom Huang感谢宝玉老师的反馈,并承诺将持续优化项目。宝玉老师指出,该项目与Claude Design相比,在界面美观度、内容完善度和交互流畅度上仍有差距,但作为开源项目初期已表现良好,具有学习借鉴价值。
Tom Huang对Jeremy的赞扬表示衷心感谢,并承诺将继续努力。Jeremy曾称赞Tom的开源项目“Claude Design”是其见过的最佳AI生成演示幻灯片工具,尽管其有使用限制,但Tom分享的开源版本仍有很大潜力。
Creating a discussion thread for IJCAI-ECAI 2026 final decision notifications. The official paper notification date is April 29, 2026 AoE, so decisions may appear at different local times depending on...
meng shao分享了一款名为“Skill: browser-trace”的浏览器可观测性工具,来自browserbase团队。它能通过额外挂载只读CDP客户端,记录DevTools事件、截图和DOM快照,供事后检索,且不干扰主自动化流程。这归因于Chrome DevTools支持并行CDP客户端。
meng shao发现了一个名为“UI Skills”的网站,尽管标题面向Design Engineer,但实际上更适合UI/UX设计师、Remotion等与设计、展示、交互、动画相关的开发者。该网站汇集了丰富的UI/UX/Remotion/Motion Graphics等相关技能资源,是学习和参考的好去处。
meng shao宣布Warp终端正式开源,采用AGPL许可证,GitHub仓库已上线。此举伴随一套以Agent为中心的协作方式,利用Oz云端编排平台,让Agent承担大部分编码、规划和测试工作,人类专注于方向审阅。OpenAI是初期赞助方,Oz工作流程中集成GPT-5.5模型。
Indie-Fox再次推荐了两款她认为体验最佳的桌面端Agent产品:OpenCode适用于编程场景,Craft Agent适用于非编程场景。她强调了这两款工具在不同使用情境下的高效性,并配有截图展示。
一部分企业(相当一部分)最终走向自用硬件(购买或租赁)来运行AI服务是必然趋势。作者认为,订阅制和按token计费的AI服务在未来可能成为企业无法承受的沉重负担。
一部分企业(相当一部分)最终走向自用硬件(购买或租赁)来运行AI服务是必然趋势。作者认为,订阅制和按token计费的AI服务在未来可能成为企业无法承受的沉重负担。
Demis Hassabis表示,很高兴看到Google DeepMind在AlphaGo问世十年后,仍能登上头条新闻。这展示了DeepMind在人工智能领域的持续影响力。
Demis Hassabis荣幸在首尔会见李在明总统,并就AI安全以及利用AI推动科学发展进行了深入交流。他强调韩国在此方面可发挥主导作用,并期待未来合作。
Gorden Sun宣布Warp终端开源,并强调其“更易用的终端客户端,对话聚合展示,输入区域交互优化”等特性。Warp团队表示,开源旨在与用户共同打造最佳、最持久的软件,开放代码、路线图及贡献流程。
哥飞推测,若当年非iOS App且未使用App Store支付,而是接入第三方支付,小公司很难实现年营收过亿,因风控问题可能导致资金流不稳定。他认为,只有Apple这类大平台,才能让小公司稳稳当当获得巨额营收。
宝玉分享了一个X.com的文章链接,具体内容需点击链接查看。
Do you ask one AI model to recommend which AI model is actually the best for specific tasks and do you find that certain AI models are more into selling themselves as opposed to being honest? submitte...
[图片: Does AI feel more trustworthy when it looks more "official"? https://external-preview.redd.it/WvGZ4SEGEReBgVNyDUjR42I61ay1i2Y2nltmIyUEd18.png?width=640&crop=smart&auto=webp&#x...
I watched Last Week Tonight's piece on AI chatbots today, and it got me thinking about that old screenshot of a Google search in which Gemini recommends adding "1/8 cup of non-toxic glue" to pizza in ...
This is the compressed version of The Landing mechanism for AI systems. What it does: Enables observation of premature classification (the landing) before response generation. Contact with signal inst...
[图片: The Day AI Stopped Being a Tab You Switch To — Claude Is Now Inside Your Software https://external-preview.redd.it/tr0LLaYeYy1NLiCLzKRClaiMCQc7StrwRT8LEDXQJMM.png?width=640&crop=smart&a...
Hello everyone, I’m a 21-year-old and I’ve been thinking about something today. What if AI is actually being used as a long-term strategy by powerful people to reduce or control the human population? ...
Current structured output benchmarks only validate pass rate for json schema and types, however more commonly the issue tends to be inaccurate json values. For example hallucinated `total_price` numbe...
Look you’re probably not going to like my answer but I guarantee that if you follow the steps i tell you…. You will get at least 10x better at AI (depending on where you’re starting) Here are the step...
A recent paper published in JMIR Mental Health (Csigó & Cserey, 2026) caught my attention. The researchers administered the 10 standard Rorschach inkblot cards to three multimodal LLMs (GPT-4o, G...
Hi everyone, I’ve always struggled with the 'friction' of calorie tracking. Most apps require you to search for every single ingredient, weigh it, and log it manually. It usually takes me 5-10 minutes...
a few weeks ago I posted about building a library that tracks 120+ AI coding tools by how long their free tier actually lasts. the response was good but the most common feedback was "your scores are s...
[图片: AI-Designed Drugs by a DeepMind Spinoff Are Headed to Human Trials. Is this significant for artificial intelligence? https://external-preview.redd.it/HUfBKyiQtQzGXDBeAhwQirqOmtApyoNhIfwyblAMWAA.j...
I'm building a tool that tries to close the gap between how institutions analyze stocks and what's available to regular investors. The idea: you give it a company (or it surfaces one from a screen), a...
Hi everyone, I’m looking for a suitable 3D point cloud dataset — or a CAD/mesh dataset from which I can sample point clouds — for a small research/report project. The goal is to compare Topological Da...
Benchmarked on 40 out-of-distribution prompts, indirect requests, roleplay framings, hypothetical scenarios, technical phrasings. The stuff that slips past everything else. Arc Gate: P=1.00, R=1.00, F...
[图片: Visualizing Loss Landscapes of Neural Networks [P] https://preview.redd.it/qrcfyilwpyxg1.gif?frame=1&width=140&height=78&auto=webp&s=187ed911ce97040c1a948a5aaed52ddb0a86f161] ...
[图片: AMDXDNA driver preps hardware scheduler time quantum for Ryzen AI multi-user fairness https://external-preview.redd.it/rwpNYXF8bY6gJ8EhjFVG2to8EvH-13c22hiG9aNANjI.jpeg?width=320&crop=smart&#...
[图片: Relational AI, Identity Formation, and the Risk of Narrative Dependency https://preview.redd.it/6b2lk13rlyxg1.jpeg?width=640&crop=smart&auto=webp&s=b71e2453050482860df23e8d4ebbf753...