作为研究人员建立AI素养：你真正需要知道什么

2026年3月14日 AI科研

研究人员的AI素养不是关于知道如何编写AI模型，而是关于充分理解AI系统以批判性地使用它们并向他人解释你的使用。这些是对实际研究使用重要的概念。

语言模型实际上如何工作（非技术版本）

大型语言模型根据从训练数据中学习的模式预测序列中的下一个单词。它们不从数据库中检索事实，而是生成模式匹配正确答案看起来样子的文本。这解释了为什么它们在错误时有自信（有自信的错误答案在训练数据中也出现），为什么它们产生幻觉引用（它们生成引用形状的文本，而不是检索的引用），以及为什么它们在常见主题上比罕见主题更好（更多训练示例=更好的模式匹配）。

知识截止日期

每个LLM都有一个训练数据截止日期，即之后的新信息未被纳入训练的日期。Claude的截止日期在2025年；GPT-4的因版本而异。截止日期之后发表的任何论文、改变的政策或做出的发现都不会在模型的知识中。对于快速发展的领域，AI提供的”当前”知识状态答案可能是一年或更多的过时信息。始终用当前数据库搜索补充AI提供的信息以获取最新工作。

上下文窗口

上下文窗口是模型一次可以”看到”多少文本，大约相当于其短期记忆。Claude Sonnet目前有200,000个词元的上下文窗口（约150,000字）。在该窗口内，模型可以看到并推理所有内容。在该窗口之外，它不存在。对于研究人员：你可以在上下文窗口内粘贴多篇论文并提问跨论文问题。对于非常长的文档（论文、多论文集），你可能会触及上下文限制，使较早的内容部分丢失。