It began as a note stuck to the wall during a 2018 brainstorming session at Experian plc’s consumer business unit. The ...
OpenAI的新论文介绍了他们在破解大模型「黑箱」上的一次重要突破,通过训练结构更简单、连接更稀疏的神经网络,为构建既强大又透明的模型提供全新方向。
打个比方,传统神经网络的工作方式就像一堆纠缠在一起的电线:每个神经元与成千上万个神经元相连,信号在其中不断流动、叠加。这些连接虽然能让模型学习复杂模式,但也形成了人类难以解读的、高度密集的连接网络。
在如今的 AI 领域,大多数大语言模型在很大程度上仍以「黑箱」方式工作,即使是专业的研究者也难以完全理解它们的内部计算过程。因此,提升模型的透明度有助于分析和解释大语言模型产生幻觉、行为不稳定或在关键场景做出不可靠判断的潜在原因。