前端&AI技术双周刊-2026.03.13

前端技术

npm v11.10.0：支持批量管理可信发布配置
npm 发布 v11.10.0 版本，新增功能允许包维护者跨多个包批量添加或更新可信发布配置，同时引入 –min-release-age 新选项，优化包发布流程。
Cloudflare 如何在一周内基于 AI 重构 Next.js
vinext 是一款基于 Vite 构建的实验性项目，重构了 Next.js 的 API 接口，可让现有 Next.js 应用在更多环境中运行，不过该方案也存在一定的取舍。本文详细介绍了 Cloudflare 团队借助 AI 技术快速完成该项目的过程。
通过指针压缩技术降低 Node.js 内存占用
Cloudflare、Igalia 与 Node 项目团队合作推出了 node-caged——一款启用 V8 指针压缩功能的 Node.js 25 Docker 镜像，实测可实现最高 50% 的内存节省效果。作者 Matteo 深入拆解了这项技术的实现细节与优化原理。
CSS 链接下划线的样式设计技巧
作者分享了个人总结的链接样式设计参考，指出 CSS 提供的一系列 text-decoration 相关属性，能够帮助开发者精准控制链接下划线的外观与行为。
border-shape：推动非矩形 Web 布局发展的新属性
作者通过多个实验，展示了 border-shape 属性的功能特点，并认为它将为 Web 平台的几何布局带来新的突破。需要注意的是，该特性目前仍处于早期阶段，仅能在 Chromium 浏览器中通过实验性标志开启使用。

AI 资讯

百度”红手指Operator” + DuClaw — 全球首款手机端OpenClaw应用 + 零门槛云端AI服务双线发力
百度智能云正式发布红手指 Operator，这是全球首款原生适配手机端的 OpenClaw 应用，目前已上线安卓市场。其核心技术亮点在于自研移动端 AI Agent 能力与 OpenClaw 协同机制：在架构层面，系统将 PC/网页端任务（深度数据抓取、跨网页资源下载、报告生成等）交由 OpenClaw 处理，将原生 App 端任务（打车、外卖订餐、社交互动等）交由 Operator 执行，两套引擎分工协作、互补覆盖。用户仅需通过自然语言指令，即可驱动 AI 完成从信息搜集到跨平台执行的全流程任务，无需任何本地环境配置。这是百度自 2 月 14 日 App 端支持一键调用 OpenClaw 以来在移动端的重要演进，结合此前推出的集成百度 AI 搜索、百科、电商等能力的技能社区 ClawHub，百度已构建起从技能生态到端侧执行的完整移动端Agent链路。
ChatGPT 动态视觉解释功能 — 70余项数理化公式实时交互可视化，AI教育助手跨越”知道”与”理解”的鸿沟
OpenAI 于 2026 年 3 月 10 日为 ChatGPT 正式推出”动态视觉解释”（Dynamic Visual Explanations）功能，目前已向所有登录用户开放，无需额外订阅。这一功能的核心是将抽象的数学和科学概念从静态文字描述转化为实时交互式可视化模块，用户通过调整参数变量，即可在屏幕上实时看到公式或定律对应的图形与数值的动态响应。本次上线覆盖 70 余个核心学术主题，涵盖数学（勾股定理、复利计算、二项式平方展开等）、物理（欧姆定律、库仑定律、透镜方程等）和化学等学科领域。
腾讯”龙虾特工队”全系产品矩阵 — WorkBuddy+SkillHub+QClaw，腾讯完成 Agent 全栈布局
2026 年 3 月 9 日—10 日，Tencent 发布 AI 智能体产品矩阵“龙虾特工队”，基于 OpenClaw 生态，覆盖个人与企业多场景应用，标志着腾讯从聊天机器人向自主执行型 AI Agent 产品体系升级。面向个人用户的 WorkBuddy 提供零部署客户端，可在约 1 分钟内接入企业微信，并兼容 OpenClaw Skills 与 MCP 协议，支持多 Agent 并行执行办公任务。内测产品 QClaw 支持通过微信远程操控电脑执行任务。企业侧则提供基于腾讯云 Lighthouse 的云端 Agent 服务及 ADP 开发平台，以支持企业级部署与权限管理。与此同时，腾讯还推出 SkillHub 技能社区与多层安全机制，以完善 AI Agent 生态体系。
Google Gemini 全面入驻 Workspace — AI深度融入全产品线，办公套件进入”智能协作”新纪元
2026 年 3 月 10 日，Google 宣布将一系列新的 Gemini AI 能力大规模集成至其核心办公产品，包括 Google Docs、Google Sheets、Google Slides 和 Google Drive。此次更新在覆盖范围与功能密度上均为 Google Workspace 历史上规模最大的 AI 升级之一，标志着 Workspace 正从“云端文件存储与协作套件”向“以 AI 为核心生产力引擎的智能工作平台”转型。
腾讯 QClaw — 腾讯将 OpenClaw 做成消费级产品，独家打通个人微信与 QQ 双端社交入口
2026 年 3 月 9 日，Tencent 内测 AI Agent 工具 QClaw，由腾讯电脑管家团队基于 OpenClaw 打造，支持 Mac 与 Windows 双平台。该产品通过对 OpenClaw 的产品化封装，降低普通用户的使用门槛。QClaw 提供本地一键启动包，用户下载安装后即可完成 OpenClaw 的自动部署，或一键关联已安装环境，无需手动配置 Node.js、Python 等依赖。通过简化安装与权限管理流程，QClaw 将原本面向开发者的部署体验转化为接近普通软件安装的使用方式，同时所有数据保留在本地设备，以增强隐私与安全保障。
火山引擎 ArkClaw — 字节跳动将 OpenClaw 云端SaaS化，打开网页即可7×24小时运行 AI 助手
2026 年 3 月 9 日，字节跳动旗下云服务平台火山引擎上线 ArkClaw，将开源 AI Agent 框架 OpenClaw 封装为开箱即用的云端 SaaS 产品。用户无需配置环境即可通过网页启动 7 × 24 小时在线的 AI 自动执行助手。ArkClaw 通过将 Agent 运行环境迁移至云端，解决了 OpenClaw 在本地部署中的环境配置复杂、成本管理困难、进程易中断及网络不稳定等问题。系统运行在专属云资源上，即使用户关闭本地设备任务仍可持续执行，并同时支持 LUI（自然语言交互）与 Terminal（命令行）两种模式，以满足不同用户的使用需求。
小米 Xiaomi miclaw —— 国内首个手机端 OpenClaw 类移动 Agent 落地
2026 年 3 月 6 日，Xiaomi 发布 Xiaomi miclaw，定位为国内首个落地手机端的“类 OpenClaw”AI 智能体交互测试产品。该产品基于小米自研的 MiMo 大模型构建，通过对复杂指令的深度理解，实现对手机端应用的主动感知与自主调度，从而将传统“用户寻找功能”的交互逻辑转向“AI 主动调度服务”的新范式。
微软必应 Sora 2 视频生成器全面免费开放 — 顶级AI视频免费化，冲击国内创作工具生态
2026 年 3 月 5 日，Microsoft 宣布其视频创作平台 Bing Video Creator 完成核心升级，正式接入 OpenAI 最新的视频生成模型 Sora 2，并向全球所有 Bing 用户免费开放。这是 Sora 2 发布以来首次以零门槛方式向消费端用户全面开放，使好莱坞级 AI 视频生成工具的使用权限进一步普及。
GPT-5.4 — OpenAI首个原生计算机操作模型，全面迈向智能体时代
2026 年 3 月 5 日，OpenAI 发布 GPT-5.4，定位为面向专业工作场景的旗舰模型，并推出 GPT-5.4、GPT-5.4 Thinking 与 GPT-5.4 Pro 三个版本。新模型整合 GPT-5.3 Codex 的编程能力，并首次在主线模型中加入原生计算机操作能力，可通过解析屏幕截图并结合自动化工具执行跨应用任务。同时支持最高 100 万 Token 上下文，并引入 Tool Search 机制以降低工具调用成本。评测显示，其在 OSWorld-Verified 中达到 75.0% 成功率，超过人类平均水平。GPT-5.4 已在 ChatGPT 与 API 平台同步上线。
Google Gemini Canvas — 搜索引擎进化为”全能创作平台”
Google 于 2026 年 3 月 5 日正式宣布，此前仅在 Google Labs 实验阶段的 Canvas 功能，现已通过 Gemini 的 AI Mode 全面向全美用户开放。这一举措标志着 Google 搜索正式开始从”信息检索工具”向”全能创作平台”的战略转型，是 Google 搜索史上最大规模的产品形态变革之一。
OpenAI Codex Windows版 — AI编程智能体跨平台全面普及
在 Mac 版本发布首周便创下 100 万次下载的惊人纪录后，OpenAI 于 2026 年 3 月 5 日正式推出了适用于 Windows 系统的 Codex 应用程序。这是 Codex 产品线的重要里程碑，也标志着这款 AI 编程智能体工具完成了对全球最主流桌面操作系统平台的覆盖布局。
Zopia — 全球首个端到端 AI 视频导演 Agent，一键生产电影级短剧
Zopia 是一款全流程 AI 视频导演 Agent，用户输入文本创意后，系统通过多智能体协同自动完成剧本拆解、分镜设计、多镜头批量渲染（已深度优化 Kling 3 和 Vidu Q3 模型）、最终剪辑及配音对口型，一键输出完整成片。最关键的是解决了以往 AI 视频工具最难攻克的三大痛点：镜头连贯性、角色一致性和多场景对齐，用户反馈显示角色微表情和环境连续性已接近专业水准。支持通过 OpenClaw 等 Bot 触发，实现24/7无人值守的批量内容生产。Seedance 2.0 集成即将上线。Beta 版目前免费开放体验。
Gemini 3.1 Flash-Lite — 首字响应速度提升2.5倍，成本极致压缩
2026 年 3 月 3 日，Google DeepMind 发布 Gemini 3.1 Flash-Lite，定位为 Gemini 3 系列中“速度最快、成本最低”的轻量模型，主要面向高并发与大规模开发者工作负载场景。该模型已通过 Google AI Studio 与 Vertex AI 向开发者开放预览，并支持 API 调用。
GPT-5.3 Instant — 幻觉率大幅下降，告别”爹味”说教
2026 年 3 月 3 日，OpenAI 向全体用户发布 GPT-5.3 Instant，覆盖 ChatGPT 网页端、移动端及 API（接口名称 gpt-5.3-chat-latest），并作为默认模型取代 GPT-5.2 Instant。此次更新重点针对用户长期反馈的高幻觉率与过度说教式语气问题进行系统性优化。官方评测显示，在医学、法律、金融等高风险领域任务中，新模型在联网状态下幻觉率下降 26.8%，离线状态下降 19.7%；在真实用户举报的事实性错误对话集中，幻觉率分别下降 22.5% 与 9.6%，整体可信度显著提升。
Google Flow AI 创意工作室 — 整合 Whisk 与 ImageFX，视频+图片全链路打通
谷歌近日宣布对实验性 AI 创作工具 Flow 进行大规模功能扩展，将旗下的图像生成工具 Whisk（风格迁移）和 ImageFX（高质量图像生成）深度集成至 Flow 的统一界面中，打造”AI 创意工作室”。此次升级后，用户可以在同一界面内完成从文字描述生成图片、通过 Whisk 进行风格迁移调整，再到图片转动画的全流程创作，彻底消除了跨工具切换的摩擦。谷歌官方演示展示了只需简单文字或素材拖拽，数分钟内即可生成具有电影质感的短片的完整工作流。
MiniMax M2.5 进驻 Notion Custom Agents — 首个国产开源权重模型打入全球顶级生产力平台，性价比颠覆闭源垄断
2026 年 3 月 2 日，Notion 联合创始人 Akshay Kothari 正式宣布，Notion Custom Agents（自定义智能体）引入由 MiniMax 研发的开源权重模型 MiniMax M2.5，作为实验性功能向全球超过 1 亿用户开放。在 Notion 的模型选择列表中，MiniMax M2.5 以“开源权重模型”的身份独立列出，与 Claude Sonnet 4.6、Claude Opus 4.6、Claude Haiku 4.5 以及 GPT-5.2、GPT-5.3 Codex 等顶级闭源模型并列呈现——这是 Notion 平台历史上首次引入开源权重模型。
Claude 记忆功能向免费用户开放 + 跨平台记忆导入工具 — Anthropic 双拳出击，重塑 AI 聊天记忆生态
2026 年 3 月 3 日，Anthropic 同步发布两项记忆功能更新，进一步推进 Claude 向“持续化个人 AI 助手”演进。首先，跨会话记忆功能正式向免费用户开放，系统可自动记录用户偏好、背景信息和表达习惯，用于后续对话个性化，同时用户可随时暂停或删除全部记忆。其次，Anthropic 推出跨平台记忆导入工具，允许用户将 ChatGPT、Gemini 等平台的记忆摘要文本直接粘贴导入 Claude，实现历史偏好与背景信息的一次性迁移，目前面向付费用户开放。
Google DeepMind STATIC：LLM 推理约束解码速度提升 948 倍，已在 YouTube 部署
Google DeepMind 与 YouTube 研究团队联合发布了名为 STATIC（Sparse Transition Matrix Accelerated Trie Index for Constrained decoding）的新型框架，将大语言模型生成式检索中的约束解码速度提升了惊人的 948倍。STATIC 的核心技术突破在于将传统约束校验依赖的前缀树（Trie）结构扁平化为静态压缩稀疏行（CSR）矩阵，使校验过程转化为 GPU/TPU 极为擅长的向量化并行运算，在30亿参数模型测试中单步延迟仅 0.033毫秒，相比 CPU 方案提升近千倍，相比现有硬件加速方案提升 40倍以上。该技术已在 YouTube 视频推荐系统中成功上线，用于确保推荐内容满足”近7天内新鲜度”等业务约束，实测新鲜视频播放量提升 5.1%，点击率也实现显著增长。
Apple Core AI 框架：生成式 AI 全面接管苹果端侧架构，Siri 迎来战略重构
苹果计划在 WWDC 2026 开发者大会上发布全新的 Core AI 框架，以取代现有的 Core ML，标志着苹果端侧 AI 战略从”传统机器学习推理”向”生成式人工智能”的全面迁移。Core AI 将承担整合第三方 AI 模型与 Apple Foundation Model 的核心底座职责，两套框架在初期可能短暂并存，但 Core AI 将逐步成为苹果生态内 AI 能力的统一入口。在具体能力上，开发者从 OS26 起可通过 Core AI 在应用内直接调用设备端 AI 推理能力，生成文本及复杂结构化结果，无需依赖云端。Core AI 还预计深度集成由 Gemini 训练的新一代苹果基础模型，并为配备类聊天机器人功能的下一代 Siri 提供技术支撑，同时引入 MCP（模型上下文协议）等潜在方案，构建更开放的端侧 AI 协同生态。
Claude Code 官方语音模式上线
Claude Code 推出了语音模式功能，使开发者能够通过自然语音快速下达指令，提升编程协作效率。该功能已逐步向用户推送，并具有实时语音转录、解放双手高效协作和原生集成稳定可靠等亮点。
阿里通义千问开源 Qwen3.5 小型模型系列
阿里通义千问团队推出 Qwen3.5 小型模型系列，包括 0.8B、2B、4B 和 9B 四款轻量级模型，支持多模态处理，适用于边缘设备和实时交互场景。该系列覆盖从 0.8B 到 397B-A17B 的完整尺寸梯度，进一步完善了开源生态。
阿里通义 Fun-CosyVoice3.5 + Fun-AudioGen-VD — FreeStyle 自然语言控制语音，双模型联袂重塑语音创作
阿里通义实验室语音团队于近日正式发布两款语音生成模型：Fun-CosyVoice3.5 和 Fun-AudioGen-VD。两款模型共同的核心创新是”FreeStyle 指令控制”——用户无需调参，仅需一句自然语言描述（如”语气坚定一点”、“语速放慢并带情绪起伏”）即可精确控制输出效果。Fun-CosyVoice3.5 是 CosyVoice 系列的升级版，新增对泰语、印尼语、葡萄牙语和越南语的支持，总计覆盖 13 种语言，生僻字读错率从 15.2% 大幅降至 5.3%，首包延迟降低 35%。Fun-AudioGen-VD 定位为”声音导演”，支持指定性别、年龄、口音和音色特质（如沙哑、磁性），可模拟客服、播音员、孩童等角色，并支持叠加环境音（战场、咖啡馆）和空间特效（教堂回声、水下感），实现全场景沉浸式音频生成。
Perplexity Personal Computer — 以 Mac mini 为本地节点，构建”目标驱动”全天候 AI 执行中枢
Perplexity 于 3 月 11 日在旧金山首届开发者大会”Ask 2026”上发布 Personal Computer，这是一款以闲置 Mac mini（或任意 Mac 设备）作为本地算力节点、将云端 AI 能力与本地文件/应用深度融合的个人 AI 执行系统。CEO Aravind Srinivas 在发布现场给出了一句极具概括力的产品定义：”传统操作系统执行指令，AI 操作系统执行目标（A traditional operating system takes instructions; an AI operating system takes objectives）”——这也精准揭示了 Personal Computer 与市面上所有对话式AI工具的根本差异：用户无需拆解步骤，只需描述期望的最终结果。
美团旗下光年之外 Tabbit 浏览器开启公测，集成多模型 AI Agent，支持全自动化网页执行
Tabbit 浏览器的发布标志着浏览器从流量入口向具备执行能力的个人办公大脑转变，为 AI 技术的应用普及和生产力重构提供了新方向。

拓展阅读

URL 中可以使用换行符和制表符
作者深入解读了 WHATWG URL 规范的相关细节，指出浏览器实际上允许在 URL 中使用换行符与制表符。虽然这并不符合标准规范，但确实可以正常工作，这一技巧能够帮助开发者避免编写过长且难以阅读的 URL 字符串。
CSS 中发现漏洞？
本文提及的漏洞是 2026 年首个重大零日漏洞，其本质是 Chromium 浏览器对 CSS @font-feature-values 规则的处理存在问题，但需要通过 JavaScript 触发。Lee 对该漏洞进行了深入分析，并提醒开发者及时更新浏览器。
CSS 自定义列表样式的深度指南
作者在本文中通过丰富的代码示例，详细讲解了 CSS 自定义列表样式的方法，内容全面详实，能为不同水平的开发者提供参考。