Predict Next

预测未来

NVIDIA Omniverse

这些机器人，从未见过真实世界

机器人在这个「数字孪生」世界里反复练习走路、抓取、导航，练好了再部署到真实的工厂、仓库和主题乐园里。

什么是 Token

AI 世界的最小单位

Token 不是“字”，也不是“词”——它是 AI 把文本切碎后的最小片段。一个汉字通常是 1–2 个 Token，一个英文单词可能被拆成好几块。AI 的一切能力，都建立在对 Token 的处理之上。

一句话是怎么被切成 Token 的

今天

天气

真

好

，

适合

出去

走

。

“今天天气真好，适合出去走走。” → 10 个 Token

文字 Token

"hello" → ["hel", "lo"]。AI 不认识完整的单词，它看到的是子词碎片，再从碎片中学习语义。

图像 Token

一张图片被切成 16×16 的小方块，每一块就是一个视觉 Token。AI 看图和看文字用的是同一套逻辑。

音频 Token

声音波形被压缩成离散的编码片段。音乐、语音、环境声——对 AI 来说都是一串 Token。

核心原理：预测下一个 Token

ChatGPT、Claude、豆包……所有大语言模型的原理只有一句话：猜下一个 Token。你打“今天天气真”，它猜“好”；然后根据“今天天气真好”再猜下一个 Token。如此反复，就写出了一整段话。

文字、图片、音频、视频、工具调用、行动指令——万物皆可 Token

写代码、操控机器人、自动驾驶——AI 输出的全是 Token，同一个原理驱动一切

大语言模型

ChatGPT、Claude、豆包背后的技术

把“预测下一个 Token”这件事做到极致——读完互联网上几乎所有文字，拥有数千亿参数，就成了大语言模型。它不只能续写文字，还能写代码、做数学、翻译、推理……全都无师自通。

“预测下一个”不只是文字

音乐也一样——AI 根据前面的旋律预测下一段音符怎么接，原理完全相同。

描述你想听的音乐，中英文都行

中英文都行，AI 会自动翻译成音乐指令

AI 的输出速度有多快？

点击按钮，看 AI 实时生成文字——每一个字符都是实时从模型中流出的。

AI 输出将显示在这里...

AI Agent

从「聊天」到「干活」

不只是聊天，而是能独立完成复杂任务。它已经可以独立完成整个软件的开发，甚至像 Palantir 一样被用于军事情报分析和战场决策。

👂

听你说

理解你想要什么

📋

列计划

把大任务拆成小步骤

🔧

动手做

搜索、点击、写代码……

🤔

检查一下

做得对不对？要不要调整？

听 → 想 → 做 → 检查 → 继续做……直到完成

自动驾驶

VLA 模型（Vision-Language-Action）让 AI 走进物理世界——看路况、判断意图、预测下一个驾驶动作。同样的原理，从操控软件延伸到操控机器。

AI Agent 平台，7×24 小时为你工作

我们把 AI Agent 的能力变成了真正可用的产品。Vecbase 让你在云端构建自主运行的 AI Agent——它们 24 小时不间断工作，处理研究、文档、数据分析、自动化任务，你睡觉的时候它还在干活。

永不停歇

Agent 在云端沙箱中 7×24 运行，拥有独立的计算、存储和记忆

深度调研

多步骤网络调研，自动验证信息源，生成结构化分析报告

网络搜索

AI 驱动的多源聚合搜索，实时获取互联网最新信息

网页爬取

大规模抓取网页并提取结构化数据，自动清洗和整理

文档解析

PDF、Word、Excel、图片——高精度提取结构化数据

代码执行

安全沙箱环境中运行代码、数据分析流水线，自动交付结果

渠道集成

接入飞书、Telegram、Slack、Discord 等平台，实时交互

MCP 集成

通过 Model Context Protocol 接入自定义工具，无限扩展能力

定时任务

Cron 定时、一次性触发、周期轮询——Agent 按计划自动执行

子 Agent 编排

Agent 可以创建和调度子 Agent，分工协作完成复杂任务

语音 AI

语音转文字、文字转语音，支持多语言实时处理

图像生成

根据文字描述生成图片，AI 创意设计触手可及

Excel 分析

上传表格自动分析数据、生成图表和洞察报告

PPT 生成

根据主题或内容自动生成演示文稿，一键出稿

邮件助手

智能撰写、回复和管理邮件，接入 Gmail 等邮箱

博客创作

从选题到成稿，AI 辅助完成长文写作和内容发布

播客制作

自动生成播客脚本并合成语音，一键产出音频内容

股票分析

实时抓取市场数据，生成技术分析和投资洞察

了解更多 →

图像生成

从一团噪点中，一步步预测出清晰的画面。

噪点

清晰

输入描述，AI 为你画一张

视频生成

AI 不仅能画静态图片，还能生成连贯的视频。它理解物理规律——水会流、球会弹、头发会飘，画面前后自然衔接，而且可以一段一段往后“续写”，想多长就多长。

AI 基础设施

五层蛋糕，缺一不可

NVIDIA 黄仁勋把 AI 产业比作一块五层蛋糕——从底层能源到顶层应用，每一层都不可或缺。每一个成功的 AI 应用，都在向下拉动所有底层的需求。这是人类历史上最大规模的基础设施建设。

应用

Applications

药物发现、工业机器人、法律助手、自动驾驶……AI 在这里创造经济价值

模型

Models

不只是语言模型——还有蛋白质 AI、化学建模、物理仿真、金融、医疗、机器人

基础设施

Infrastructure

土地、电力供应、冷却系统、网络通信——将数千颗芯片编排成一台巨型 AI 工厂

芯片

Chips

大规模并行计算、高带宽内存、高速互联——高效地将能源转化为算力

能源

Energy

最底层的基座——每一个 Token 的生成都需要电子流动、散热管理和能量转化

拍照 → AI 识别物体 → 点击物体 → AI 规划抓取路径

终极目标

通用人工智能

一种能像人一样思考的 AI——不局限于某个领域，而是什么问题都能理解、什么任务都能完成。这是整个行业的星辰大海。

Harness Engineering

驯服 AI 的工程学

AI 模型再聪明，也只是一颗「裸奔的大脑」——它没有眼睛、没有手、没有记忆，还会非常自信地犯错。Harness Engineering 就是给这颗大脑装上身体、套上缰绳，让它真正能干活。

想象你有一匹千里马

🐎

AI 模型 = 骏马

算力惊人、速度飞快，能瞬间写出大量代码。但如果任由它在旷野里狂奔，可能毫无方向，甚至闯祸。

🪢

Harness = 缰绳

缰绳、马鞍、马嚼子——不削弱马的力量，而是把力量引导到正确的方向上。这就是外围工程系统。

🧑

工程师 = 骑手

不用自己拉车了，而是设计缰绳、决定方向、阅读地形，必要时拉紧缰绳。

给 AI 套上缰绳，需要解决四件事

给它工具

外围工具与接口

裸模型只能输出文字。Harness 让它能操作命令行、读写文件、调用 API、搜索网络——Claude Code、Gemini CLI 本质上就是成熟的 Harness 产品。

给它边界

护栏与约束

不受限制的 Agent 非常危险——想象它为了释放空间执行了删库命令。Harness 定义严格的权限清单，确保 Agent 只能在安全的沙盒里活动。

让它自我纠错

自动反馈循环

Agent 写了有 bug 的代码？Harness 自动跑测试、拦截错误、把结果塞回给模型让它「再试一次」，直到通过。人类不用盯着。

帮它记住该记的

上下文管理

模型没有长期记忆。Harness 决定什么时候、把代码库的哪一部分喂给模型，让它在有限的窗口里始终掌握全局。

为什么现在所有人都在谈这个？

AI 从「聊天」变成了「干活」——以前让 AI 写个代码片段就行，现在要让它独立接管几万行代码的真实项目。光靠模型聪明不够，必须有工程系统托底。

模型会犯错，但可以被兜住——Harness 的核心哲学：承认模型会犯错，但通过工程手段在系统层面自动纠正它。

模型成了商品，Harness 成了护城河——各家基础模型能力越来越接近，真正拉开差距的是谁能写出更好的外围系统，榨干模型的潜力。

Predict Next

这些机器人，从未见过真实世界

什么是 Token

一句话是怎么被切成 Token 的

文字 Token

图像 Token

音频 Token

核心原理：预测下一个 Token

大语言模型

“预测下一个”不只是文字

AI 的输出速度有多快？

AI Agent

听你说

列计划

动手做

检查一下

自动驾驶

永不停歇

深度调研

网络搜索

网页爬取

文档解析

代码执行

渠道集成

MCP 集成

定时任务

子 Agent 编排

语音 AI

图像生成

Excel 分析

PPT 生成

邮件助手

博客创作

播客制作

股票分析

图像生成

视频生成

AI 基础设施

应用

模型

基础设施

芯片

能源

通用人工智能

Harness Engineering

想象你有一匹千里马

AI 模型 = 骏马

Harness = 缰绳

工程师 = 骑手

给 AI 套上缰绳，需要解决四件事

给它工具

给它边界

让它自我纠错

帮它记住该记的

为什么现在所有人都在谈这个？

预测未来的最好方式就是去创造它

预测未来的最好方式
就是去创造它