研究人员的AI素养不是关于知道如何编写AI模型,而是关于充分理解AI系统以批判性地使用它们并向他人解释你的使用。这些是对实际研究使用重要的概念。
语言模型实际上如何工作(非技术版本)
大型语言模型根据从训练数据中学习的模式预测序列中的下一个单词。它们不从数据库中检索事实,而是生成模式匹配正确答案看起来样子的文本。这解释了为什么它们在错误时有自信(有自信的错误答案在训练数据中也出现),为什么它们产生幻觉引用(它们生成引用形状的文本,而不是检索的引用),以及为什么它们在常见主题上比罕见主题更好(更多训练示例=更好的模式匹配)。
知识截止日期
每个LLM都有一个训练数据截止日期,即之后的新信息未被纳入训练的日期。Claude的截止日期在2025年;GPT-4的因版本而异。截止日期之后发表的任何论文、改变的政策或做出的发现都不会在模型的知识中。对于快速发展的领域,AI提供的”当前”知识状态答案可能是一年或更多的过时信息。始终用当前数据库搜索补充AI提供的信息以获取最新工作。
上下文窗口
上下文窗口是模型一次可以”看到”多少文本,大约相当于其短期记忆。Claude Sonnet目前有200,000个词元的上下文窗口(约150,000字)。在该窗口内,模型可以看到并推理所有内容。在该窗口之外,它不存在。对于研究人员:你可以在上下文窗口内粘贴多篇论文并提问跨论文问题。对于非常长的文档(论文、多论文集),你可能会触及上下文限制,使较早的内容部分丢失。
温度和确定性
AI模型有一个控制随机性的”温度”设置。较高温度=更有创意、更多变化的输出。较低温度=更确定、更保守。对于你想要一致性的研究任务(数据提取、分类),倾向于较低的温度设置(某些工具会暴露此设置)。对于头脑风暴(研究想法生成),较高温度产生更多样化的建议。
向同事和导师解释什么
当你的导师或委员会询问你如何使用AI时:具体说明工具、目的和你核实了什么。”我使用Claude帮助构建我的文献综述大纲,然后根据我对原始来源的阅读自己写内容”是一个完整且可信的解释。”我使用AI来帮助写作”不够具体,会引发你应该能够回答的后续问题。




