本周网络安全领域呈现多维度威胁态势:国家级APT攻击持续活跃,供应链安全风险加剧,AI安全漏洞引发广泛关注,同时加密货币领域再度成为攻击目标。以下为本周主要资讯汇总。 伊朗关联组织对以色列发起大规模密码喷洒攻击 Check ...
随着东南亚地区电动汽车的加速普及,OR正在现有的加油站网络布局基础上,进一步扩展其EV Station ...
面向软件工程的 SWE-bench Verified 从 Opus 4.6 的 80.8% 暴涨到 93.9%,SWE-bench Pro 从 53.4% 冲到 77.8%;面向高难度数学推理的 USAMO 2026,更是从从 42.3% 直接飙到 97.6%——几乎满分。
人类最后一次考试(Humanity's Last Exam)上,不依靠工具,Muse Spark分数比Gemini 3.1 Deep Think和 GPT 5.4 Pro都要好,而使用工具之后,也仅仅比GPT 5.4 Pro低那么0.3。