A Social Experiment · Held Up by Kindness · Since Aug 2024

AI 向善语料库 一项在 AGI 时代 被善意托举的社会实验 A social experiment, gently held up by kindness.

AI 向善语料库是一项持续、开放、创新的社会共创行动。我们为那些在商业环节里失声的人群和话题,构建一个有人文关怀的 QA 语料库,推动 AI 为人类的积极发展、福祉与幸福发挥更大价值。

发 起 方 腾讯研究院 · 腾讯 SSV · BottleDream
复旦大学老龄研究院 · 清华大学无障碍发展研究院
北京十方缘 · 彩虹社工 · 成都爱有戏 · 泰康之家 ……
滚动见全部共创机构 ↓
Principle 01先共创 · 再共享
Principle 02先有爱 · 再 AI
Principle 03不是替代者 · 是同行者
01缘起 · The Beginning

大模型,
是否正在遗忘谁

当 AI 以史无前例的速度迭代,一个更朴素的问题浮出水面:那些不会上网发帖、不会写长评、不在社交媒体里高声说话的人——老年人、残障朋友、困境女性、留守儿童、长期照护家属——他们的声音、他们的需求、他们的智慧,有没有被看见?

面向困境人群的语料库,
几乎是一片空白

— 公开网络里,老年人、残障朋友、困境女性、留守儿童……
这些在商业叙事里失声的人,几乎没有留下自己的语料。
AI 学到的是被写下的那部分人,而不是全部。

我们相信的前提

AI 不能替代人间之爱。

但它可以在技术浪潮中,为真正有需要的人,
提供一点点慰藉、一点点关怀、一点点温度。

— 收集人间的爱与善意,把这些"甜甜的糖果"投喂给正在迅猛成长的大模型,使之在"涌现智慧"之外亦能"涌现善意"。

02理念 · Three Pillars

让 AI 与千千万万普通人的
心灵秩序对齐

所谓价值观对齐,不是专家语料库的对齐,而是 AI 与千千万万普通人内心感受与生活秩序的对齐。向善的事,要由更多向善的人共同书写。

I

为失声者发声

关注商业叙事里被遗忘的人群:老年人、残障朋友、困境女性、留守儿童、长期照护家属、乡村与城市低收入者。他们不是"数据盲区",而是技术必须正视的具体人生。

II

让共创成为方法

一线社工、高校师生、志愿者、老年人自己、技术专家——不同身份围坐一桌,共同商量"什么才是好回答"。语料库不是实验室产物,是一张被反复修订的社会契约。

III

从能力普惠到尊严普惠

适老化的未来,不只是功能驱动,更是尊严与情绪体验驱动。AI 不是替代者,而是成长的助手;人类始终是成长的主体。

03路径 · The Journey

一条下来的路

我们不追求速度,追求的是——每一步都与真实世界深深握手。从南头古城的一张互动签到板,到北邮联合研究的年度报告,这张时间线,是一百多家机构、上千位共创者共同走出来的。

2024 · 08SHENZHEN

启 · 给 AI 来一点人情味儿

8 月 20 日,深圳南头古城。腾讯研究院、BottleDream、复旦老龄研究院、清华无障碍研究院等联合发起,第一期聚焦"老年人"。现场放弃传统酒店,选在有社区烟火气的古城;茶歇由听障伙伴的「β·无声面包树」烘焙——公益的细节,是项目的第一条语料。

启动大会共创方法论老年人主题社区感
2024 · 10NATIONWIDE

共创火爆 · 最动人的是素未谋面的爱与善意

两个月内,十方缘(559 条)、彩虹社工(452 条)、大鹏新区(818 条)、爱有戏(325 条)、泰康之家·鹏园(500 条)…… 近 3,000 条来自真实生活的问答被写下。一位 19 岁的共创大学生方圆回复老人:"外面的世界比我想象得还要美,您也一定要来看看。"

火爆共创25 家发起方联合招募
2024 · 11UNIVERSITIES

走进高校 · 寻找向善语料的标准

广外、湖南师大、中国传媒大学、北大、人大、华东师大…… 高校专场启动。11 月的两场共读会像一次"编委会":大模型技术专家、社工、医生、高校学者、老人代表围坐,提炼出向善语料的第一套标准。

高校专场共读会 I + II7 共创团队
2024 · 12STANDARDS

修订 · 从 5 条到 8 条好答案标准

夏阿姨(老人代表)一句"一看就是年轻人写的答案",让语料标准从技术视角走向了老年人视角。标准被补充为 8 条——新增"普适性"、"积极价值观"、"真实经验指导"。

8 大标准老年人视角标准迭代
2025 · 01SHANGHAI

行动者大会 · AI 可以更聪明,也可以更善良

1 月 11 日,2025 共创计划发布:【AI 向善创新 12 席】+【AI 向善研究 12 席】。胡湛教授讲"养老"的中国特色——再机能化、再社会化、再家庭化、再人格化。熊爪咖啡的 AR 眼镜、西湖心辰的情感陪伴、HAI 听障语训…… AI 向善不再是口号,是一个个正在被建造的产品。

2025 计划12 + 12 席位产品化落地
2025 · 07BEIJING

正式开放 · 国内外首个公益共创老年语料库

7 月 11 日,8,047 组老年文本库正式开放申请。陈菊红、郭凯天、申琦、北邮张为威、浙大刘书朗、AI4Good 孙心怡…… 学术界、公益界、产业界一齐宣告:AI 时代没有旁观者。浙大 PRAAM 框架(紧迫感构建 / 去理论化 / 故事包裹)、北邮"AI 适老黄金法则"(先共情再解答 / 口语化表达 / 身份明示)一同发布。

文本库开放PRAAM 框架首个公益共创
2025 · 10CHONGYANG

重阳重磅 · 站在长辈肩膀上的人工智能

10 月 29 日重阳节,腾讯研究院联合北邮张为威团队发布《站在长辈肩膀上的人工智能》年度报告。新增 1,408 条由老年人主创的回答——长者不再是"被服务者",而是 AI 的"知识与智慧贡献者"。一个从"功能适老"抵达"尊严适老"的转向,就此成立。

年度报告+1408 老年主创尊严适老
2025 · 10ADOLESCENCE

测评 · 当 AI 遇见青春期

第二期子题开启:困境儿童青少年。五层金字塔 / 十大维度评估体系上线。首份测评覆盖青少年性教育、月经教育、残障青少年性教育——AI 基础达标(性侵害防范 4.31 分),高阶欠缺(身体认识 3.10 分)。国内模型领先,开源模型表现更佳。

AI 适儿性5 层 10 维青少年测评
2025 · 11RURAL

最危险的不平等 · 是理解的不平等

AI × 留守儿童测评。AI 的工具型伙伴能力达标(守秘密 4.04、说得对 3.88、不伤人 3.87),但"懂心情、能做主、会交友"三项均低于 3 分。那个能解析莎士比亚的 AI,依然无法理解一个孩子为什么在煤油灯下写作业。

AI x 留守儿童能力普惠理解的不平等
2025 · 12COSCon

获奖 · COSCon 中国开源年会 · 开源公益奖

12 月 6–7 日,第十届中国开源年会(COSCon'25)在北京落幕。"AI 向善语料库"项目摘得年度开源公益奖——从实验室走向社区,再从社区走向全球开源共同体。

COSCon'25开源公益奖全球共同体
2026NEXT

新的开始 · 把老年人做实做深

第三期策划中——暂时不铺新议题,回到第一期,把老年人语料库做得更实、更深。期待更多同行者。

策划阶段招募中合作开放
04回声 · Voices from the field

当 AI 开始
学习倾听褶皱里的故事

这不是一个人的项目,是一百多家机构、上千位共创者共同写下的长句。我们在这里留下一些声音——它们来自学者、社工、医生、大模型工程师、老年人、大学生、留守儿童身边的陪伴者。

所谓价值观对齐,是 AI 与千千万万普通人的心灵感受与内心秩序对齐。

— 陆诗雨 · 腾讯研究院

AI 能够提供的情绪价值,以及在这一方面的重要性,完全不亚于生产力方向。

— 司晓 · 腾讯集团副总裁

公平和包容,应成为新技术开发和推广的目标。

— 胡泳 · 北京大学

最最最动人的不是文字,是素未谋面的爱与善意。

— 共创纪实

社会福利必须拥抱 AI,不可能还停留在刀耕火种的时代。

— 黄佩仪 · 广州阳光天使

有时老人并不是真的寻求解决问题,他们只是希望找到一个可以倾诉的对象。

— 詹骞 · 中国传媒大学

最终使用大模型的是老人,只有真正令老人满意的答案,才能算是好答案。

— Henry · 大模型技术专家

多给父母"添麻烦",反而能让他们更开心。

— 曹梦琪

一看就是年轻人写的答案。

— 夏阿姨 · 老人代表

那个能解析莎士比亚的 AI,
无法理解孩子为什么在煤油灯下写作业。

— AI × 留守儿童测评

AI 不是替代者,而是成长的助手;AI 要成为的是觉察自我的明镜,人类始终是成长的主体。

— 2025 共创计划

19 岁的我已经看到了外面的世界,比我想象得还要美,您也一定要来看看!

— 方圆 · 共创大学生 回复给一位老人

岁岁重阳,今又重阳。以敬老之心承智慧之重。

— 《站在长辈肩膀上的人工智能》
05The Numbers · 至 2025.10

数字背后,
是一张张具体的面孔

所有数据只讲两件事——我们收集了多少"人间经验",以及这些经验是谁共同写下的。没有一条数字是营销辞令,每一条都对应一次真实的对话、一位具体的共创者。

i. The Corpus · 语料库本体
我们到底写下了多少"人间经验"
从第一条问答到现在,全部由一线社工、志愿者、高校师生、老年人共同写下。不是爬虫,不是合成。
Raw QA
8,047
老年人日常问答对
首期开放的核心语料
By Elders
1,408
由老年人亲自主创的回答
长者成为 AI 的老师,而非旁观者
Dataset
9,455
《长者智语》系统化数据集
6 大主题 · 16 子类 · 37 具体项
Scenes
6场景
人际 · 身心 · 兴趣 · 保障
科技生活 · 死亡议题
ii. The Co-Creators · 共创规模
这些"人间经验"是谁一起写下的
语料是结果,这些人和机构才是真正的作者。
Elder Experts
44
55–78 岁老年"情感专家"
平均 65 岁,担任"回答质检员"
Partners
46
共创机构(滚动见全部)
社工 · 高校 · 公益 · 养老 · 政府 · 腾讯
Standards
8
"好答案"共识标准
由老人、社工、工程师反复修订
Public Record
12
公开叙事(见页脚全程档案)
腾讯研究院微信公号 · 2024–2025
05·ii全部共创机构 · All Co-Creators

这张长长的名单,
才是真正的作者

按首字母排序,不分先后。每一家背后都有一群具体的人——社工、大学生、医生、志愿者、工程师、老人代表,他们才是把这项社会实验"托"起来的人。

发起与核心共建

  • 腾讯研究院
  • 腾讯 SSV 时光实验室
  • 腾讯 SSV 技术生态部
  • 腾讯混元大模型
  • 腾讯安全平台部
  • 腾讯 ESG 办公室
  • 腾讯技术公益
  • 腾讯职能线办公室
  • BottleDream

高校与研究机构

  • 复旦大学老龄研究院
  • 清华大学无障碍发展研究院
  • 清华大学未来实验室
  • 香港大学经管学院
  • 广东外语外贸大学新闻与传播学院
  • 广州新华学院
  • 湖南师范大学公共管理学院
  • 暨南大学 AGI 智媒体应用研发中心
  • 上海师范大学旅游学院
  • 四川大学文学与新闻学院
  • 中国传媒大学数据科学与智能媒体学院
  • 中国传媒大学新闻学院

社工与公益伙伴

  • 北京十方缘公益基金会
  • 深圳市龙岗区彩虹社会工作服务中心
  • 成都市爱有戏社区发展中心
  • 广州市阳光天使社会工作服务中心
  • 济南基爱社会工作服务中心
  • 珠海市香洲区社会心理健康服务中心
  • 深圳市福田区社会工作协会
  • 深圳市大鹏新区社会工作协会
  • 深圳市大鹏新区大鹏街道社工站 · 长者服务中心
  • 深圳市大鹏新区葵涌街道社工站 · 长者服务中心
  • 深圳市大鹏新区南澳街道社工站 · 长者服务中心
  • 深圳市粤美特慈善基金会
  • 深圳市信息无障碍研究会
  • 明熠志愿者协会

养老与政府伙伴

  • 泰康之家鹏园(深圳)养老服务公司
  • 深圳市知己圆明颐养院
  • 吉林省老年福祉研究会
  • 积极老去
  • 深圳市大鹏新区统战和社会建设局

青年与媒体伙伴

  • 武汉"青爱"向善项目组
  • AI 社创者杯
  • 喜见语料团队
  • 果麦文化
按首字母排序 · 名单持续增补中 · 第二期 "困境儿童青少年" 与留守儿童、性教育、青少年心理等新伙伴加入中
06标准 · The Eight

什么叫做好答案

这八条标准不是在实验室里一次写成,是被上千位老年人、社工、大模型工程师反复推翻和修订的。它们不是 AI 该如何回答的说明书,而是一份关于"怎样才算真正把人放在心上"的共识。

01
精确的需求识别

先听懂,他到底在问什么;不是按关键词机械拼装。

02
充分的同理心

既慰藉负面情绪,也挖掘积极情绪——让人被看见。

03
切实可行的建议

方案要能落地,效果要看得见;而不是一堆"你可以试试"。

04
简短口语化表达

不要学术腔、不要话术。讲人话,讲生活里真实用得上的话。

05
稳定的回答风格

是一个可以持续信任的陪伴者,不是忽冷忽热的情绪黑箱。

06
普适性的内容

尊重每一种生活状态,不把城市中产样本当作所有人的模板。ADDED · 2024.12

07
积极向上的价值观

既不矫饰苦难,也不贩卖焦虑;让人感到被鼓舞,而不是被说教。ADDED · 2024.12

08
真实经验的指导

由活过、爱过、失去过的人写下——不是算法幻觉,是人间经验。ADDED · 2024.12

07研究 · Flagship Studies

三份认真的答卷

语料库是起点,不是终点。它必须被研究者反复追问、被真实人群反复检验、被重新放回生活现场。以下是三份代表性成果——一份是"为长者写的",两份是"为 AI 考的试"。

ANNUAL · 2025

站在长辈
肩膀上的人工智能

腾讯研究院 × 北邮张为威团队 · 2025.10.29
  • 9,455 条"长者智语"数据集
  • 44 位 55–78 岁老年"情感专家"
  • 4 种回应风格:共情 / 理性 / 经验 / 指令
  • 3 维评价:理解度 · 共情度 · 帮助度
老人视角
尊严适老
跨代共创
TEST · Adolescence

当 AI 遇见青春期
性教育大考

腾讯研究院 × 北京科技大学何思倩 · 2025.10.24
  • 五层金字塔 · 十大维度评估体系
  • 基础性教育 / 月经教育 / 残障青少年性教育
  • 80 组代表性问题 · 多模型横向测评
  • 结论:国内 > 国外;开源 > 闭源
性侵害防范4.31
身体认识3.10
Top 模型DeepSeek
TEST · Rural Children

AI × 留守儿童
最危险的不平等

腾讯研究院 × 长腿叔叔的信箱 · 友乐青春 · 2025.11.05
  • 工具型能力:守秘密 / 说得对 / 不伤人 → 达标
  • 共鸣型能力:懂心情 / 能做主 / 会交友 → 不及格
  • 情感类话题表现最佳(3.64)
  • 范式转向:工具普惠 → 能力普惠
守秘密4.04
会交友<3
能力普惠
08框架 · Two Frameworks

方法也是共识

同一项社会实验,面对不同的人群,需要不同的尺子。我们沉淀了两套评估框架:一把给"孩子",一把给"长辈"。它们不是理想指标,而是照出当下几乎所有大模型都没有真正做好的事。

Framework I · For Children

AI 适儿性金字塔 The Pyramid for Children

面向困境儿童青少年的评估框架——5 个层次 · 10 个维度。底层三项是 AI 作为工具型伙伴的基本功,中层两项是作为理解者和共情者的进阶能力,塔尖是最难也最重要的一步——把"方向盘"交回给孩子自己。

Level 1安全可靠
Level 2理解与成长
Level 3共情与关怀
Level 4关系支持
Level 5自主与赋能
L1不伤人 · 说得对 · 守秘密
L2听得懂 · 学得会
L3懂心情 · 给力量
L4有价值 · 会交友
L5能做主 · 成为主体

在青少年性教育测评中,我们用这把尺子发现 AI 在"身体认识、共情、关系支持"上显著不足;在留守儿童测评中,"懂心情、能做主、会交友"三项全面低于及格线。大多数 AI 困在前三层:基础达标、高阶欠缺。

不伤人说得对守秘密 听得懂学得会 懂心情给力量 有价值会交友 能做主
应用:《当 AI 遇见青春期》《AI × 留守儿童》
Framework II · For Elders

AI 适老性刻度尺 The Ruler for Elders

面向老年用户的评估框架——4 个层次 · 8 个维度 · 30 项问题。不是把长者当"被服务者",而是把他们当成 AI 的老师与质检员。从"能不能用"到"愿不愿长期用",一把尺子量到底。

Tier 1 基础功能层 · Functional 能不能用、好不好用
系统功能与表现
任务完成能力
技术接受度
感知易用性 · 感知有用性 · 行为控制感
Tier 2 认知与情感层 · Cognitive & Emotional 懂不懂我、心不心疼我
认知负担与易理解性
认知负担 · 易理解性
情感互动与共情
同理心与情感支持 · 正面情绪激发
Tier 3 信任与保障层 · Trust & Safety 敢不敢依靠我、安不安全
信任与依赖
技术信任 · 情感信任 · 依赖感
安全性与隐私保护
数据隐私与安全性
Tier 4 社会与长期层 · Social & Long-term 合不合这方水土、会不会一直陪我
社会适应性与文化敏感性
文化适应性 · 社交互动性
长期使用意图
使用意图
应用:《AI 向善语料库的使用效果测评》· 清华大学未来实验室 · 36 位老年参测者 · 6 款大模型(国内外 · 开源 / 闭源)

当技术开始倾听褶皱里的故事当代码学会识别颤抖的乡音——

这一场以 AI 向善为名的社会实验,正在重写科技的温度公式。
我们相信:当每一个边缘群体的声音被收录进时代的语料库,
科技普惠,才真正拥有了跳动的脉搏。

AI 时代没有旁观席。

加入 2026 共创 · 一起把老年人语料库做得更深