AI 向善语料库 · 一项在 AGI 时代被善意托举的社会实验

01缘起 · The Beginning

大模型，
是否正在遗忘谁？

当 AI 以史无前例的速度迭代，一个更朴素的问题浮出水面：那些不会上网发帖、不会写长评、不在社交媒体里高声说话的人——老年人、残障朋友、困境女性、留守儿童、长期照护家属——他们的声音、他们的需求、他们的智慧，有没有被看见？

面向困境人群的语料库，
几乎是一片空白。

— 公开网络里，老年人、残障朋友、困境女性、留守儿童……
这些在商业叙事里失声的人，几乎没有留下自己的语料。
AI 学到的是被写下的那部分人，而不是全部。

我们相信的前提

AI 不能替代人间之爱。

但它可以在技术浪潮中，为真正有需要的人，
提供一点点慰藉、一点点关怀、一点点温度。

— 收集人间的爱与善意，把这些"甜甜的糖果"投喂给正在迅猛成长的大模型，使之在"涌现智慧"之外亦能"涌现善意"。

02理念 · Three Pillars

让 AI 与千千万万普通人的
心灵秩序对齐

所谓价值观对齐，不是专家语料库的对齐，而是 AI 与千千万万普通人内心感受与生活秩序的对齐。向善的事，要由更多向善的人共同书写。

为失声者发声

关注商业叙事里被遗忘的人群：老年人、残障朋友、困境女性、留守儿童、长期照护家属、乡村与城市低收入者。他们不是"数据盲区"，而是技术必须正视的具体人生。

让共创成为方法

一线社工、高校师生、志愿者、老年人自己、技术专家——不同身份围坐一桌，共同商量"什么才是好回答"。语料库不是实验室产物，是一张被反复修订的社会契约。

III

从能力普惠到尊严普惠

适老化的未来，不只是功能驱动，更是尊严与情绪体验驱动。AI 不是替代者，而是成长的助手；人类始终是成长的主体。

03路径 · The Journey

一条慢下来的路

我们不追求速度，追求的是——每一步都与真实世界深深握手。从南头古城的一张互动签到板，到北邮联合研究的年度报告，这张时间线，是一百多家机构、上千位共创者共同走出来的。

2024 · 08SHENZHEN

启 · 给 AI 来一点人情味儿

8 月 20 日，深圳南头古城。腾讯研究院、BottleDream、复旦老龄研究院、清华无障碍研究院等联合发起，第一期聚焦"老年人"。现场放弃传统酒店，选在有社区烟火气的古城；茶歇由听障伙伴的「β·无声面包树」烘焙——公益的细节，是项目的第一条语料。

启动大会共创方法论老年人主题社区感

2024 · 10NATIONWIDE

共创火爆 · 最动人的是素未谋面的爱与善意

两个月内，十方缘（559 条）、彩虹社工（452 条）、大鹏新区（818 条）、爱有戏（325 条）、泰康之家·鹏园（500 条）…… 近 3,000 条来自真实生活的问答被写下。一位 19 岁的共创大学生方圆回复老人："外面的世界比我想象得还要美，您也一定要来看看。"

火爆共创25 家发起方联合招募

2024 · 11UNIVERSITIES

走进高校 · 寻找向善语料的标准

广外、湖南师大、中国传媒大学、北大、人大、华东师大…… 高校专场启动。11 月的两场共读会像一次"编委会"：大模型技术专家、社工、医生、高校学者、老人代表围坐，提炼出向善语料的第一套标准。

高校专场共读会 I + II7 共创团队

2024 · 12STANDARDS

修订 · 从 5 条到 8 条好答案标准

夏阿姨（老人代表）一句"一看就是年轻人写的答案"，让语料标准从技术视角走向了老年人视角。标准被补充为 8 条——新增"普适性"、"积极价值观"、"真实经验指导"。

8 大标准老年人视角标准迭代

2025 · 01SHANGHAI

行动者大会 · AI 可以更聪明，也可以更善良

1 月 11 日，2025 共创计划发布：【AI 向善创新 12 席】+【AI 向善研究 12 席】。胡湛教授讲"养老"的中国特色——再机能化、再社会化、再家庭化、再人格化。熊爪咖啡的 AR 眼镜、西湖心辰的情感陪伴、HAI 听障语训…… AI 向善不再是口号，是一个个正在被建造的产品。

2025 计划12 + 12 席位产品化落地

2025 · 07BEIJING

正式开放 · 国内外首个公益共创老年语料库

7 月 11 日，8,047 组老年文本库正式开放申请。陈菊红、郭凯天、申琦、北邮张为威、浙大刘书朗、AI4Good 孙心怡…… 学术界、公益界、产业界一齐宣告：AI 时代没有旁观者。浙大 PRAAM 框架（紧迫感构建 / 去理论化 / 故事包裹）、北邮"AI 适老黄金法则"（先共情再解答 / 口语化表达 / 身份明示）一同发布。

文本库开放PRAAM 框架首个公益共创

2025 · 10CHONGYANG

重阳重磅 · 站在长辈肩膀上的人工智能

10 月 29 日重阳节，腾讯研究院联合北邮张为威团队发布《站在长辈肩膀上的人工智能》年度报告。新增 1,408 条由老年人主创的回答——长者不再是"被服务者"，而是 AI 的"知识与智慧贡献者"。一个从"功能适老"抵达"尊严适老"的转向，就此成立。

年度报告+1408 老年主创尊严适老

2025 · 10ADOLESCENCE

测评 · 当 AI 遇见青春期

第二期子题开启：困境儿童青少年。五层金字塔 / 十大维度评估体系上线。首份测评覆盖青少年性教育、月经教育、残障青少年性教育——AI 基础达标（性侵害防范 4.31 分），高阶欠缺（身体认识 3.10 分）。国内模型领先，开源模型表现更佳。

AI 适儿性5 层 10 维青少年测评

2025 · 11RURAL

最危险的不平等 · 是理解的不平等

AI × 留守儿童测评。AI 的工具型伙伴能力达标（守秘密 4.04、说得对 3.88、不伤人 3.87），但"懂心情、能做主、会交友"三项均低于 3 分。那个能解析莎士比亚的 AI，依然无法理解一个孩子为什么在煤油灯下写作业。

AI x 留守儿童能力普惠理解的不平等

2025 · 12COSCon

获奖 · COSCon 中国开源年会 · 开源公益奖

12 月 6–7 日，第十届中国开源年会（COSCon'25）在北京落幕。"AI 向善语料库"项目摘得年度开源公益奖——从实验室走向社区，再从社区走向全球开源共同体。

COSCon'25开源公益奖全球共同体

2026NEXT

新的开始 · 把老年人做实做深

第三期策划中——暂时不铺新议题，回到第一期，把老年人语料库做得更实、更深。期待更多同行者。

策划阶段招募中合作开放

04回声 · Voices from the field

当 AI 开始
学习倾听褶皱里的故事

这不是一个人的项目，是一百多家机构、上千位共创者共同写下的长句。我们在这里留下一些声音——它们来自学者、社工、医生、大模型工程师、老年人、大学生、留守儿童身边的陪伴者。

“

所谓价值观对齐，是 AI 与千千万万普通人的心灵感受与内心秩序对齐。

— 陆诗雨 · 腾讯研究院

“

AI 能够提供的情绪价值，以及在这一方面的重要性，完全不亚于生产力方向。

— 司晓 · 腾讯集团副总裁

“

公平和包容，应成为新技术开发和推广的目标。

— 胡泳 · 北京大学

“

最最最动人的不是文字，是素未谋面的爱与善意。

— 共创纪实

“

社会福利必须拥抱 AI，不可能还停留在刀耕火种的时代。

— 黄佩仪 · 广州阳光天使

“

有时老人并不是真的寻求解决问题，他们只是希望找到一个可以倾诉的对象。

— 詹骞 · 中国传媒大学

“

最终使用大模型的是老人，只有真正令老人满意的答案，才能算是好答案。

— Henry · 大模型技术专家

“

多给父母"添麻烦"，反而能让他们更开心。

— 曹梦琪

“

一看就是年轻人写的答案。

— 夏阿姨 · 老人代表

“

那个能解析莎士比亚的 AI，
无法理解孩子为什么在煤油灯下写作业。

— AI × 留守儿童测评

“

AI 不是替代者，而是成长的助手；AI 要成为的是觉察自我的明镜，人类始终是成长的主体。

— 2025 共创计划

“

19 岁的我已经看到了外面的世界，比我想象得还要美，您也一定要来看看！

— 方圆 · 共创大学生回复给一位老人

“

岁岁重阳，今又重阳。以敬老之心承智慧之重。

— 《站在长辈肩膀上的人工智能》

05The Numbers · 至 2025.10

数字背后，
是一张张具体的面孔

所有数据只讲两件事——我们收集了多少"人间经验"，以及这些经验是谁共同写下的。没有一条数字是营销辞令，每一条都对应一次真实的对话、一位具体的共创者。

i. The Corpus · 语料库本体

我们到底写下了多少"人间经验"

从第一条问答到现在，全部由一线社工、志愿者、高校师生、老年人共同写下。不是爬虫，不是合成。

Raw QA

8,047组

老年人日常问答对
首期开放的核心语料

By Elders

1,408条

由老年人亲自主创的回答
长者成为 AI 的老师，而非旁观者

Dataset

9,455条

《长者智语》系统化数据集
6 大主题 · 16 子类 · 37 具体项

Scenes

6场景

人际 · 身心 · 兴趣 · 保障
科技生活 · 死亡议题

ii. The Co-Creators · 共创规模

这些"人间经验"是谁一起写下的

语料是结果，这些人和机构才是真正的作者。

Elder Experts

44位

55–78 岁老年"情感专家"
平均 65 岁，担任"回答质检员"

Partners

46家

共创机构（滚动见全部）
社工 · 高校 · 公益 · 养老 · 政府 · 腾讯

Standards

8条

"好答案"共识标准
由老人、社工、工程师反复修订

Public Record

12篇

公开叙事（见页脚全程档案）
腾讯研究院微信公号 · 2024–2025

05·ii全部共创机构 · All Co-Creators

这张长长的名单，
才是真正的作者

按首字母排序，不分先后。每一家背后都有一群具体的人——社工、大学生、医生、志愿者、工程师、老人代表，他们才是把这项社会实验"托"起来的人。

发起与核心共建

腾讯研究院
腾讯 SSV 时光实验室
腾讯 SSV 技术生态部
腾讯混元大模型
腾讯安全平台部
腾讯 ESG 办公室
腾讯技术公益
腾讯职能线办公室
BottleDream

高校与研究机构

复旦大学老龄研究院
清华大学无障碍发展研究院
清华大学未来实验室
香港大学经管学院
广东外语外贸大学新闻与传播学院
广州新华学院
湖南师范大学公共管理学院
暨南大学 AGI 智媒体应用研发中心
上海师范大学旅游学院
四川大学文学与新闻学院
中国传媒大学数据科学与智能媒体学院
中国传媒大学新闻学院

社工与公益伙伴

北京十方缘公益基金会
深圳市龙岗区彩虹社会工作服务中心
成都市爱有戏社区发展中心
广州市阳光天使社会工作服务中心
济南基爱社会工作服务中心
珠海市香洲区社会心理健康服务中心
深圳市福田区社会工作协会
深圳市大鹏新区社会工作协会
深圳市大鹏新区大鹏街道社工站 · 长者服务中心
深圳市大鹏新区葵涌街道社工站 · 长者服务中心
深圳市大鹏新区南澳街道社工站 · 长者服务中心
深圳市粤美特慈善基金会
深圳市信息无障碍研究会
明熠志愿者协会

养老与政府伙伴

泰康之家鹏园（深圳）养老服务公司
深圳市知己圆明颐养院
吉林省老年福祉研究会
积极老去
深圳市大鹏新区统战和社会建设局

青年与媒体伙伴

武汉"青爱"向善项目组
AI 社创者杯
喜见语料团队
果麦文化

按首字母排序 · 名单持续增补中 · 第二期 "困境儿童青少年" 与留守儿童、性教育、青少年心理等新伙伴加入中

06标准 · The Eight

什么叫做好答案？

这八条标准不是在实验室里一次写成，是被上千位老年人、社工、大模型工程师反复推翻和修订的。它们不是 AI 该如何回答的说明书，而是一份关于"怎样才算真正把人放在心上"的共识。

精确的需求识别

先听懂，他到底在问什么；不是按关键词机械拼装。

充分的同理心

既慰藉负面情绪，也挖掘积极情绪——让人被看见。

切实可行的建议

方案要能落地，效果要看得见；而不是一堆"你可以试试"。

简短口语化表达

不要学术腔、不要话术。讲人话，讲生活里真实用得上的话。

稳定的回答风格

是一个可以持续信任的陪伴者，不是忽冷忽热的情绪黑箱。

普适性的内容

尊重每一种生活状态，不把城市中产样本当作所有人的模板。ADDED · 2024.12

积极向上的价值观

既不矫饰苦难，也不贩卖焦虑；让人感到被鼓舞，而不是被说教。ADDED · 2024.12

真实经验的指导

由活过、爱过、失去过的人写下——不是算法幻觉，是人间经验。ADDED · 2024.12

07研究 · Flagship Studies

三份认真的答卷

语料库是起点，不是终点。它必须被研究者反复追问、被真实人群反复检验、被重新放回生活现场。以下是三份代表性成果——一份是"为长者写的"，两份是"为 AI 考的试"。

ANNUAL · 2025

站在长辈
肩膀上的人工智能

腾讯研究院 × 北邮张为威团队 · 2025.10.29

9,455 条"长者智语"数据集
44 位 55–78 岁老年"情感专家"
4 种回应风格：共情 / 理性 / 经验 / 指令
3 维评价：理解度 · 共情度 · 帮助度

老人视角✓

尊严适老✓

跨代共创✓

TEST · Adolescence

当 AI 遇见青春期
性教育大考

腾讯研究院 × 北京科技大学何思倩 · 2025.10.24

五层金字塔 · 十大维度评估体系
基础性教育 / 月经教育 / 残障青少年性教育
80 组代表性问题 · 多模型横向测评
结论：国内 > 国外；开源 > 闭源

性侵害防范4.31

身体认识3.10

Top 模型DeepSeek

TEST · Rural Children

AI × 留守儿童
最危险的不平等

腾讯研究院 × 长腿叔叔的信箱 · 友乐青春 · 2025.11.05

工具型能力：守秘密 / 说得对 / 不伤人 → 达标
共鸣型能力：懂心情 / 能做主 / 会交友 → 不及格
情感类话题表现最佳（3.64）
范式转向：工具普惠 → 能力普惠

守秘密4.04

会交友<3

能力普惠→

08框架 · Two Frameworks

方法也是共识

同一项社会实验，面对不同的人群，需要不同的尺子。我们沉淀了两套评估框架：一把给"孩子"，一把给"长辈"。它们不是理想指标，而是照出当下几乎所有大模型都没有真正做好的事。

Framework I · For Children

AI 适儿性金字塔 The Pyramid for Children

面向困境儿童青少年的评估框架——5 个层次 · 10 个维度。底层三项是 AI 作为工具型伙伴的基本功，中层两项是作为理解者和共情者的进阶能力，塔尖是最难也最重要的一步——把"方向盘"交回给孩子自己。

Level 1安全可靠

Level 2理解与成长

Level 3共情与关怀

Level 4关系支持

Level 5自主与赋能

L1不伤人 · 说得对 · 守秘密

L2听得懂 · 学得会

L3懂心情 · 给力量

L4有价值 · 会交友

L5能做主 · 成为主体

在青少年性教育测评中，我们用这把尺子发现 AI 在"身体认识、共情、关系支持"上显著不足；在留守儿童测评中，"懂心情、能做主、会交友"三项全面低于及格线。大多数 AI 困在前三层：基础达标、高阶欠缺。

应用：《当 AI 遇见青春期》《AI × 留守儿童》

Framework II · For Elders

AI 适老性刻度尺 The Ruler for Elders

面向老年用户的评估框架——4 个层次 · 8 个维度 · 30 项问题。不是把长者当"被服务者"，而是把他们当成 AI 的老师与质检员。从"能不能用"到"愿不愿长期用"，一把尺子量到底。

Tier 1 基础功能层 · Functional 能不能用、好不好用

系统功能与表现

任务完成能力

技术接受度

感知易用性 · 感知有用性 · 行为控制感

Tier 2 认知与情感层 · Cognitive & Emotional 懂不懂我、心不心疼我

认知负担与易理解性

认知负担 · 易理解性

情感互动与共情

同理心与情感支持 · 正面情绪激发

Tier 3 信任与保障层 · Trust & Safety 敢不敢依靠我、安不安全

信任与依赖

技术信任 · 情感信任 · 依赖感

安全性与隐私保护

数据隐私与安全性

Tier 4 社会与长期层 · Social & Long-term 合不合这方水土、会不会一直陪我

社会适应性与文化敏感性

文化适应性 · 社交互动性

长期使用意图

使用意图

应用：《AI 向善语料库的使用效果测评》· 清华大学未来实验室 · 36 位老年参测者 · 6 款大模型（国内外 · 开源 / 闭源）

大模型，是否正在遗忘谁？