ROUTE A · THE QUESTIONS
我想知道,
模型究竟学会了什么。
为什么模型只是预测 token、mask 或下一个声音片段,最后却形成了可以迁移的表征?这些表征与大脑处理声音的方式,又有多少相似?
01
NeuroAI
把模型与大脑放进同一套可检验的问题里,而不是停留在相似性的想象中。
02
Speech Models
围绕 wav2vec 2.0、HuBERT、BEATs、AVES,追踪声音表征如何逐层形成。
03
Brain Alignment
比较模型结构、训练目标与数据分布,如何影响它们与听觉皮层活动的对应。
“把模型、大脑和真实世界智能,放在同一张图里理解。”