电话: 邮箱:
诚 朴 雄 伟   励 学 敦 行 SINCERITY · SIMPLICITY · STRIVING · PRACTICE

真人龙虎斗

真人龙虎斗

尊龙凯时中国官网入口 马斯克透顶把 X 平台给开源了,但是我却复刻不出来

发布日期:2026-05-19 07:13 来源:未知 作者:admin 浏览次数:

尊龙凯时中国官网入口 马斯克透顶把 X 平台给开源了,但是我却复刻不出来

东谈主在北京的马斯克,方针却是欧洲

自从马斯克开源 X 以后,大师总会憎恨说"马斯克你这东谈主不纯正,搭理开源却莫得开源完好,大师拿到代码也没倡导我方作念个 X 平台"。

但是现时不错了,X 开源仓库页迎来史上最大更新,你果然不错下且归我方造个 X 平台了。

马斯克第一次公开 X 推选算法代码,是在 2023 年 3 月 31 日。那时平台还叫 Twitter,官方把 twitter/the-algorithm 和 twitter/the-algorithm-ml 两个仓库放上 GitHub,公开了 For You 时候线背后的部分推选逻辑。

但那次更像一次"代码透明度展示",外界能看到推选系统的基本运作形貌,却拿不到老师数据、模子权重、告白推选系统等要津部分。

而此次,马斯克玩果然了。

诚然,X 并不是全球最大的酬酢平台。它的月活数目为 5.7 亿,X 在 2026 年的预测收入约为 29 亿好意思元,比马斯克收购前的 50.8 亿好意思元下落了 43%,收购前 X 的告白收入占比高达 90%,收购后告白收入仍占总收入的不到 70%。

但是它仍然是全球最巨大的酬酢平台之一,每天处理 12 亿条内容、职业 5 亿用户的完好出产系统。Anthropic、OpenAI 这些全球最顶尖的 AI 公司,齐以 X 当作第一信息分发平台。

马斯克发出这条 X 不到 24 小时,X 的开源 GitHub 仓库眨眼间冲到了 2 万颗星星。

马斯克在开源声明中说:"咱们知谈这个算法很笨,需要大幅改良,但至少你不错看到咱们及时且透明地奋发让它变得更好。莫得其他酬酢媒体公司这样作念。"

推选算法是酬酢媒体的中枢交易奥妙,是决定用户"看什么、信什么、买什么"的底层逻辑。

在此之前,莫得任何一家主流平台知足把这套逻辑完好地摆到台面上。

马斯克作念了。

01 开源的具体内容?

此次开源的 X 算法,中枢是一个基于 Grok 的 transformer 推选系统。

总共这个词系统的架构并不复杂,谋略念念路很明晰:从两个开头赢得候选内容,然后用机器学习模子长入溜序,临了过滤掉不对适的内容,推送给用户。

两个内容开头差别是 Thunder 和 Phoenix Retrieval。

Thunder 负责"网内内容" ( In-Network ) ,也即是你关心的账号发布的帖子。它是一个内存数据库,及时跟踪总共效户的最新发帖,反馈速率不错达到亚毫秒级别。

当你刷新信息流时,Thunder 会坐窝把你关心的东谈主最近发的内容拉出来。

Phoenix Retrieval 负责"网外内容" ( Out-of-Network ) ,也即是你没关心、但系统以为你可能感有趣的帖子。

它通过机器学习作念相似度搜索,从全球语料库里找出和你往时互动内容研究的帖子。这是推选系统最要津的部分,决定了你会不会在信息流里看到目生账号的爆款内容。

两个开头的候选内容汇总之后,会插足长入的排序阶段。这个阶段的中枢是 Phoenix Scorer,一个基于 Grok 的 Transformer 模子。

这个模子不预测"研究性",而是预测你对每条内容可能收受的具体步履,比如点赞概率、转发概率、回复概率、点击概率、举报概率、屏蔽概率。

每个步履齐有一个权重,正向步履(点赞、转发)权重为正,负向步履(举报、屏蔽)权重为负。最终得分是总共预测概率的加权乞降。

得分高的内容排在前边,得分低的内容排在背面。

仅此资料。

X 在开源文档里超过强调了少许:咱们如故透顶摒除了总共手工特征工程和大部分启发式端正。

Grok-based Transformer 承担了总共吞吐的责任,它通过一语气你的互动历史,比如你点赞了什么、回复了什么、共享了什么,然后基于此自动判断什么内容和你研究。

这意味着,往时那些依赖要津词堆砌、标签匹配的运营策略如故失效了。系统现时更留心语义一语气,能够深度分析内容的本色价值和用户的委果需求。

开源是开源了,但并不是实足开源。

起初,模子权重莫得实足通达。

GitHub 仓库里如实包含了一个预老师的 mini Phoenix 模子,256 维镶嵌、4 个介怀力头、2 层 Transformer,打包成一个 3GB 的压缩包,通过 Git LFS 分发。这个模子不错让路发者平直跑起来端到端的推理进程,不需要我方老师。

但这仅仅一个"迷你版"。X 在出产环境里信得过使用的 Phoenix 模子,范围要大得多,参数目、层数、镶嵌维度齐不在一个量级上。开源的这个 mini 模子,更像是一个教育样本,让你一语气系统怎么责任,但不是 X 信得过在用的阿谁。

它像一台教育用小发动机,能让你看懂发动机道理,也能果然转起来,但它不是 X 每天给几亿用户刷 For You 信息流时用的那台信得过发动机。

信得过的出产模子八成率更大、更复杂、老师数据更多、调参更多,知谈的用户步履也更多。是以它推选得准不准、反应快不快、能弗成扛住委果流量,和这个 mini 模子不是一个量级。

其次,老师数据莫得公开。

推选系统的中枢竞争力,一半在模子,一半在数据。X 每天处理 12 亿条内容,积蓄了海量的用户步履数据,比如谁点赞了什么、谁屏蔽了谁、谁在什么时候看了哪些内容、看了多久。

这些数据才是 Phoenix 模子能够准确预测用户步履的根底原因。

但这些数据不可能开源。一方面是阴私问题,尊龙凯时中国官网入口另一方面是交易奥妙。

莫得这些数据,即使你拿到了完好的模子架构和代码,也老师不出一个和 X 相似好用的推选系统。

第三,告白系统只开源了框架,莫得开源策略。

PC加拿大(中国)官方网站

此次开源包含了一个新的 ads 模块,处理告白注入和定位,包括品牌安全跟踪,会尊重敏锐内容鸿沟。但具体的告白竞价逻辑、出价策略、ROI 优化算法,这些平直关系到 X 收入的中枢理制,并莫得实足公开。

第四,内容一语气管谈 Grox(Grox 是 X 推选系统里,基于 Grok 构建的内容一语气工程职业)只开源了部分智力。

Grox 是一个新加入的职业,提供分类器、镶嵌器和任务推论引擎,用于垃圾检测、帖子分类、PTOS 战略推论等内容一语气责任。但 Grox 具体怎么判断一条内容是垃圾、怎么识别违法内容、怎么推论平台战略,这些细节并莫得实足透明。

是以,你天然不错左证 GitHub 开源的这些东西去造一个访佛 X 的酬酢平台,但你造不出一个和 X 相似好用的推选系统。

你不错拿到完好的系统架构、候选调回逻辑、排序框架、过滤端正,不错跑通端到端的推理进程。若是你有鼓胀的工程智力,如实不错搭建一个访佛的推选系统。

但是你莫得 X 的数据、莫得 X 的出产级模子、莫得 X 在往时几年里积蓄的工程优化和退换策略。也就没倡导 1 比 1 复刻 X 平台。

02 为什么要开源?

早在 2022 年 10 月收购 Twitter 的时候,他就公开示意:"让算法开源以加多信任"是他对这个平台的愿景之一。

2023 年 3 月 31 日,马斯克完毕了第一个开心。那时还叫 Twitter 的 X 平台,在 GitHub 上发布了部分推选算法的源代码,包括用户时候线里推文推选的算法逻辑。

那次开源激励了巨大关心。

开采者们第一次看到了 Twitter 推选系统的里面运作形貌,也第一次说明了一些长期流传的听说,比如,某些账号如实会被算法降权,某些内容类型如实会被优先推选。

马斯克那时说,提供"代码透明度"一运转会"令东谈主难以置信地无语",但最终会"导致推选质地的快速晋升"。

他还说:"最巨大的是,咱们但愿赢得你们的信任。"

但那次开源并不完好。GitHub 仓库里的大部分文献齐来自起初的上传,后续更新很少。好多开采者憎恨,代码库莫得捏续保养,文档不够详备,好多要津模块莫得公开。

此次开源,马斯克显然吸取了资格。

更有道理的是,马斯克在 X 上发布算法更新的那条推文时,他东谈主正在北京。但此次开源的信得过方针,是欧洲。

X 平台在欧洲靠近着越来越严格的监管审查,而马斯克正在用"透明"和"通达"当作刀兵,去招架监管压力。

2025 年 7 月,法国巡视机关对 X 平台张开打听,怀疑其算法存在偏见和诓骗性数据索求步履。

欧盟委员会也对 X 发出了文献保留令,条目其提供算法研究内容,打听要点是失误信息传播、内容审核不力和信息透明度弱势。

X 平台那时终止合作打听,并指控这是一场"出于政事动机的刑事打听",挟制到用户的言论解放。

马斯克以致在欧盟委员会的推文下回复了一个脏话。

但终止合作显然不是长久之计,于是马斯克把算法给开源了。

与其被迫收受监管机构的审查,不如主动把代码公开,让全寰宇的开采者、操办者、监管者齐能看到 X 的推选逻辑。

这样一来,X 不错声称我方是"全球最透明的酬酢平台",任何干于算法偏见、内容主宰的指控,齐不错用"代码如故开源,你们我方去看"走动答。

迫切才是最佳的防护。

天然,开源也不是莫得代价的。

起初,竞争敌手不错平直学习 X 的架构谋略和工程现实。现时别东谈主彻透顶底地操办 X 是怎么作念调回、怎么作念排序、怎么作念万般性约束的。

若是 X 的某些谋略如实比竞品好,那么这些谋略很快就会被复制。

其次,开源走漏了 X 的短处。

开采者们如故在 GitHub issue 区指出了一些问题:为什么某些过滤端正谋略得不够合理?为什么万般性约束的参数成立得这样保守?为什么告白注入的逻辑这样浅显恶毒?

但马斯克以为,这些代价是值得的。

X 现时边临的最大问题不是时刻,而是信任。用户不信任 X 的内容审核,告白主不信任 X 的品牌安全,监管机构不信任 X 的算法平允性。

开源算法,是重建信任的最平直形貌。

它弗成措置总共问题,但至少不错讲明 X 莫得在暗箱操作,X 的推选逻辑是不错被考试的,X 知足收受公众监督。

在一个越来越强调透明度和问责制的期间,这种姿态自己即是一种竞争力。

马斯克在 2023 年开源 Twitter 算法时说过一句话:"咱们但愿 X 成为互联网上最透明的系统,并让它像最盛名、最到手的开源状况 Linux 相似苍劲。"

现时看来,他是追究的。

X 能弗成果然形成"酬酢媒体界的 Linux ",还需要时候考据。

但至少在开源这件事上尊龙凯时中国官网入口,马斯克如故走在了总共主流酬酢平台的前边。