在周一发生 Z 世代年轻人抗议以及紧跟着的暴力冲突之后,尼泊尔宣布取消社媒禁令。这次大规模抗议中有至少 19 人死亡,300-400 人受伤,总理 Sharma Oli 已宣布辞职。尼泊尔政府是在上周以未在期限内向政府登记注册为由屏蔽了 Facebook、WhatsApp、X、Instagram 和 YouTube 等 26 个社交媒体网站,引发了 Z 世代年轻群体周一在包括首都在内的各大城市的大规模抗议,这次事件被称为 Z 世代抗议运动。
Red Hat 准备将大量后台业务员工及相关支持团队迁移到母公司 IBM。IBM 是在 2019 年以 340 亿美元收购了 Red Hat,之后一直独立运营,但情况正在发生变化。这次迁移预计在 2026 年初生效,公司员工本月初收到了通知。Red Hat 的人力资源、财务、会计和法务等行政及行政管理部门的大部分员工将加入 IBM。Red Hat 没有披露行政及行政管理团队的人员规模,它的全球员工总数约为 19,000 人,大部分人任职于工程、销售和支持部门。对于这次迁移,工程、产品、销售和市场营销团队不受影响,至少目前是如此。
清华、蚂蚁和新加坡南洋理工的研究人员在预印本平台 arxiv 上发表了一篇论文《Speculating LLMs’ Chinese Training Data Pollution from Their Tokens》,指出 OpenAI 的 GPT 系列模型使用的中文语料被成人和网络赌博内容污染。大模型使用从互联网上爬取的内容进行预训练,而爬取的内容不可避免会混入成人色情或网络赌博等污染内容。如果不仔细清理数据,那么在构建词汇表和执行分词(Performing tokenization)时可能会生成污染词元(polluted tokens),GPT 系列模型使用的中文词汇表就存在大量污染的中文词元。GPT-o1/o3/4.5/4.1/o4-mini 等模型都使用污染的中文语料库进行了训练。研究人员发现,在 GPT 模型语料库中,超过 23% 的长中文词元或者是成人内容或者是网络赌博,以 GPT-4o 为例,与日本 AV 女星波多野结衣相关的网页比例占到了训练语料库的 0.5%。
Windows 11 第三方工具 Flyoobe 11 允许用户移除微软在操作系统中捆绑的臃肿软件。它最近释出了更新 v1.7,允许用户在安装操作系统后发现并禁用所有 AI 和 Copilot 功能。开发者称,最新版本能更深入挖掘 AI 在 Windows 11 中的嵌入方式。Flyoobe 托管在微软旗下的 GitHub 上,采用 MIT 许可证。