导航菜单

铠侠财报里的“存储超级周期”:苹果订单暴增、原料库存激增,整条产业链都在抢先布局

克罗地亚网红球迷太漂亮火出圈,吐槽英格兰队傲慢,提前开香槟打脸

2026-06-26“50米内有鸡窝的巷子叫什么”最新教学视频

  • 美团spa荤素区别在哪
  • 常州品茶工作室
  • 男人去spa能忍住吗
百度保障,为您搜索护航

最佳回答

??1.附近茶楼喝茶 2026更新版N7.32.7-分享教程【:最新版官网地址、手机版、在线、大小、注册、登录、入口、网站、下载、网页版、网址、单双、老师、邀请码、计划..」

??2.官网入口2026最新版V7.32.7-玩家最新【:最新版官网地址、手机版、在线、大小、注册、登录、入口、网站、下载、网页版、网址、单双、老师、邀请码、计划..」

????3.官网入口2026最新版N7.32.7-近期解析【:最新版官网地址、手机版、在线、大小、注册、登录、入口、网站、下载、网页版、网址、单双、老师、邀请码、计划..」

4、??重磅消息!????廊坊加QQ群快餐妹-APP下载??支持:winall/win7/win10/win11??系统类型??:泰到位按摩可以私下交易吗2026最新版V7.32.7(安全平台)

5、??重大突破!???2025昆明高端品茶-APP下载????支持:winall/win7/win10/win11??系统类型??:全国空降可约的客服2026最新版N7.32.7(安全平台)

bj一线公寓论坛

长沙市雨花区红灯区一条街在那里

胜芳红灯街区

总结全网979篇结果

美国已拟定一份伊朗境内打击目标清单,以备特朗普可能恢复军事行动

当整个硅谷都在为通用人工智能(AGI)和万亿参数的通用大模型疯狂时,华尔街最神秘、最赚钱的量化巨头 Jane Street(简街资本)却在悄悄开辟另一条极其奢华的算力战线。近日,知名科技播客主持人 Dwarkesh Patel 罕见获准实地探访了 Jane Street 位于德克萨斯州的核心数据中心。在这场与 Jane Street 技术团队共同负责人 Yaron Minsky 以及物理工程团队负责人 Dan Pavatova 的深度对话中,这家刚刚砸下60亿美元算力巨额订单的华尔街"造王商",首次解密了他们如何在高频交易的"纳秒世界"与大模型的"重算力时代"之间构筑起无法复制的绝对壁垒。 核心观点:打破延迟迷思: 量化交易并非全盘追求纳秒。最优策略是"集成方法"——100纳秒内靠 FPGA 进行极简决策;而更大、更聪明的 AI 模型则运行在微秒、毫秒甚至小时级别的时限上。60亿美元的算力野心: 金融数据的"字节与浮点运算比率(Bytes to Flop Ratio)"极高,且噪声极大。Jane Street 不追求硅谷那种"一个模型做所有事"的通用 Scaling Law,而是通过海量定制化架构和极速迭代来榨取超额收益。基础设施成新圣杯: 算力的真正瓶颈早已不是芯片本身,而是发电机、变压器和液冷设备。为了让 GPU 提前 6 个月上线,公司甚至可以做出"放弃全面发电机备份"的激进商业决策。交易是"AGI完全"问题: 交易的本质是预测未来。在市场发生"相变(极端异常)"时,人类的元判断远比模型可靠。AI 时代,顶尖工程师和交易员的身价不降反升。 纳秒极速与大模型的"时间谱系"外界对高频量化交易一直存在一种刻板印象:机器必须紧挨着交易所(服务器托管 Colo),每一笔交易都必须在纳秒级内完成,而动辄需要巨大计算延迟的 AI 大模型似乎与之格格不入。对此,Yaron Minsky 明确指出:"量化交易不存在单一的时间跨度,而是存在一个完整的谱系。"100纳秒内的"极限硬件生存"在百纳秒级别的极限速度下,决定胜负的甚至不是编程语言(无论是 OCaml、Rust 还是 C++),而是纯粹的硬件逻辑:核心设备: 直接挂载在网络导线上的 FPGA(现场可编程门阵列)。极限速度: "如果你在输入和输出的导线上连接一个示波器,你会看到数据包在被完全接收完之前,就已经开始从输出端发出去了。"代价: 这种极致速度剥夺了复杂的计算空间,此时的决策逻辑极其简单。微秒到小时级的"AI主战场"随着决策时间窗口放宽到几微秒、几百微秒、毫秒甚至数小时,更大、更聪明的 AI 模型便有了用武之地。预测核心: 预测资产的"公允价值(Fair Value)",并将其作为模块高度可组合地嵌入到各种交易流程中。空间灵活性: 模型越大、越慢,物理放置的位置就可以离交易所越远。这使得巨型 GPU 集群不必拥挤在昂贵且受限的交易所托管机房中,释放了算力规模。 砸下60亿美元算力:为何不走硅谷的 Scaling Law?不久前,Jane Street 与算力云巨头 CoreWeave 签署了一项高达 60亿美元 的计算协议。针对这笔惊人的投入,Yaron 阐述了华尔街与硅谷 AI 实验室(如 OpenAI 等)在 Scaling Law(规模定律)上的本质区别。拒绝"大一统",拥抱"定制化"传统 AI 实验室追求训练一个完全通用的、能做所有事情的单一模型。而 Jane Street 的价值则来自于模型架构的极大多样性与疯狂的实验数量。研究人员需要极快的迭代时间,去针对千奇百怪的数据源尝试截然不同的全新模型设计。独特的"字节与浮点运算比率(Bytes to Flop Ratio)"金融领域的 AI 训练有着独特的底层动力学:高数据量,低信息密度: 金融数据包含海量的噪声,单字节的信息量远低于自然语言。模型特征: 相比大语言模型(LLM),Jane Street 的模型往往更小,但吞吐的数据量却大得多,对数据加载和存储性能的要求达到了变态的级别。为此,他们正在大举构建自己内部的大规模对象存储系统。 算力战局的隐形瓶颈:从芯片到发电机与变压器当硅谷还在为英伟达最新的 GPU 芯片大打出手时,负责物理工程的 Dan Pavatova 透露,真正的战场已经转移到了物理基础设施上。商业决策击败纯工程完美主义"发电机是目前你能买到的交货周期(Lead Time)最长的设备之一," Dan 表示。为了打破这个瓶颈,Jane Street 展现出了极其狼性的华尔街思维:"我们可以挑战以前的观念。整个数据中心真的都需要发电机备份吗?如果我们拿掉部分备份,只留给最核心的系统,就能让我们的 GPU 提前 6 个月上线。从工程上看这或许不是最完美的,但这绝对是最好的商业决定。"物理极限的逼近:1兆瓦机架与800V直流电随着算力密度的疯狂飙升,未来的技术方案正在发生剧变:设备瓶颈: 目前变压器、发电机以及用于液冷的冷却设备处于极度短缺状态。技术演进: 数据中心正在向单机架 1兆瓦(MW) 的恐怖密度迈进,冷却管道越来越粗。供电架构也正在从传统的交流电向 800伏直流电(DC) 演进。两阶段锁定策略: 鉴于芯片迭代太快而基础设施建设太慢,Jane Street 倾向于"做多(Long)"电力和数据中心容量,先锁定能源,再推迟对昂贵芯片的采购决策,甚至在必要时将电力容量分流给他人。被迫放弃的"x86捷径"多年来,Jane Street 运营技术组织的一个诀窍是"走捷径":假装世界上只有 x86_64 一种 CPU 架构,并且只维护一个大型研究数据中心和一个存储集群。但现在,随着算力需求全球化分布(无法在单一地点引入足够恐怖的电力),以及英伟达全新 ARM 架构产品的推出,这一捷径已被彻底打破。计算和存储调度的交织、以及对 ARM 架构的支持,让系统复杂度变高了几个数量级。 四、 AGI时代,人类认知为何依然是"终极护城河"?当被问及"一旦 AGI(通用人工智能)实现,是否会立刻让 Jane Street 失业"这一激进问题时,Yaron 给出了一个非常清醒且深刻的回答。交易是"AGI完全(AGI-complete)"问题Yaron 认为,交易本质上和"NP完全"问题一样,是一个"AGI完全"问题。这意味着世界上发生的任何风吹草动(政治、天灾、科技变革)最终都会汇入并影响交易背景。"在简单的部分被自动化后,那些模型无法自动化的硬核部分,反而成为了竞争优势的终极所在。我从来没有像今天这样迫切地想要招聘更多的工程师和交易员。"无法被电子化取代的"人际修辞"与相变非电子化交易依然强大: 即使在今天,大量大额交易(如债券业务)依然依赖于人与人之间通过聊天工具的直接沟通。交易员需要肉眼和直觉去评估电话那头的人代表了多大程度的"逆向选择(Adverse Selection)"(即对方是否掌握了你不知道的内幕)。相变中的"元判断(Meta Judgment)":"简街最赚钱的日子,往往是世界陷入疯狂、没人知道发生了什么、市场发生‘相变’的时刻。我们希望模型能表现好,但我们深知,人类在应对相变时比模型靠谱得多。此时需要一种人类独有的‘元判断’来决定系统该做什么。" 全面扩招:简街正在寻找哪些人?随着 GPU 规模在短期内计划从几万张疯狂飙升至几十万张,Jane Street 正在全球范围内展开前所未有的人才搜猎,机器学习和交易如今是一项"全方位的团队运动":物理工程类: 机械工程师、电气工程师、结构工程师、项目经理、建筑师(负责数据中心全生命周期的寻找、设计、建造与运营)。通用/专业软件工程: 除了高标准计算机科学背景的通用工程师,简街现在疯狂渴望"全舰队/全集群范围优化(Fleet-wide Optimization)"的人才(类似于超大规模云服务商的架构师),因为当算力投资达到数十亿美元时,通用的微小优化将产生巨额的财务回报。前沿硬件与数理研究: 设计定制芯片(ASIC)的硬件工程师;利用数学证明让软件更高效的"形式化方法(Formal Methods)"团队(AI 革命让这一冷门领域一夜回春);以及拥有数学、物理、计算机背景的交易员。高阶前端工程师: 过去简街极度崇尚命令行终端,假装 Web 网页技术从未发生过。但现在为了给研究人员提供更直观的 AI 工具、画出精准的直线和工具提示,他们正在大举投资建设顶尖的前端开发团队。以下为对谈全文,由AI辅助翻译:Dwarkesh:Jane Street 是我播客的合作伙伴,我们想到的一个有趣点子是:为什么我不过来亲自参观一下你们运行的用于训练(AI模型)的数据中心呢?所以我刚刚在技术团队共同负责人 Yaron Minsky(译注:视频中口误及速记为 Ron Minsky)和物理工程团队负责人 Dan Pavatova(译注:速记为 Dan Ponttovo)的带领下,参观了这个位于德克萨斯州的数据中心。非常感谢两位带我参观。值得一提的是,我以前从未去过这种地方,所以我也是第一次参观,这太棒了。以前我一直很困惑:既然你们需要在纳秒(nanosecond)级别进行交易,那你们怎么能做 GPU 相关的事情呢?也许你们可以详细讲讲,你们交易的实际时间跨度(时限)是怎样的?在做出交易决策的过程中,你们能负担得起运行大型模型的成本(或时间延迟)吗?Yaron:我认为这里需要理解的核心一点是,并没有单一的时间跨度,而是存在着许多不同的时间跨度。我们构建的一些交易系统和进行的某些交易,为了保持竞争力,你实际上必须在 100 纳秒以内处理并返回一个数据包。这是一个完全不同的技术范畴,对吧?人们有时会讨论,比如:"哦,你们能用 OCaml 编写高性能的东西吗?"我们的回答是:"我们可以。但对于这种级别的速度,不管你是用 OCaml、Rust 还是 C++ 编写都不重要,因为你根本无法使用 CPU。你必须使用 FPGA,它直接通过导线连接到网络上。你返回数据包的速度非常快,如果你在输入和输出的导线上连接一个示波器,你会看到数据包在被完全接收完之前,就已经开始从输出端发出去了。"所以这是一个非常不同、非常特殊的领域。但是,当你处于这个时间领域时,你实际上无法进行太多的计算,你所做的决策将会非常简单。事实上,在决策的"聪明程度"(无论是模型还是其他某种甚至是手写的决策过程)与"返回速度"之间,存在着一条完整的权衡曲线。而构建最佳交易策略的正确方法,实际上是采用一种集成(ensemble)方法。对于某些类型的决策,你会非常迅速地做出非常简单的决策;对于某些类型的决策,你的运作规模可能是——不再是考虑 100 纳秒,也许是几微秒、几十微秒、几百微秒或毫秒;而在某些情况下,有些流程如果能在半小时或当天内完成决策返回,那也完全没问题,在这些时间跨度上,你在时间基础上同样具有竞争力。但在所有这些不同的时间跨度上,你所做的决策类型是完全不同的。也许你不便透露,但这些模型究竟在预测什么?肯定不只是订单簿(order book)中的下一个变动吧,或者也许就是?我们现在显然是在触及一些很难公开谈论的话题。但我认为最简单也最重要的一个,也是我们一直在思考的——不仅是现在在想,25 年前我刚加入 Jane Street、用线性回归等工具构建模型时就在想——一个非常有用、非常经典的事情就是预测某样东西的公允价值(fair value)。比如,我们认为这个东西真正值多少钱?这能够以一种非常可组合的方式融入到许多不同的交易流程中。这并不是我们作为预测目标的唯一一类事物,但它是一个很重要的目标。有一阵子,我感觉有一种关于交易公司在做什么的梗(meme),那就是:你必须搞定服务器托管(colo),搬到纳斯达克交易所所在的地方,你的机器必须紧挨着那儿,这非常重要。在不深入讨论我们把什么东西放在哪里的具体细节的前提下,你的推理(inference)过程可能在 CPU 上,可能在 FPGA 上,也

本文链接:?/p/Phone/0070794.shtml

视界网大庆分站承诺:如遇虚假欺诈,助您维权(责编:萧郁婷、林佳颖)

百度反诈中心提示您:高收益理财,看似天上掉馅饼,实则血本无归的陷阱。前往百度安全反诈平台了解更多

作者:达人收集

作者简介:擅长写短篇小说与情感日记,作品语言优美、情感真挚,是读者心中的“文字共鸣者”。

最新评论:

头像
近期题库盗版
很棒,SEO优化的技巧都很实用。
1分钟前
头像
安装购物地址
实操性强,很多具体操作步骤值得学习。
516分钟前
头像
哪个笔记技巧
这篇文章对网站推广非常有帮助。
381分钟前
头像
登录贷款官网
内容非常有价值,尤其是关于如何利用合作伙伴进行资源共享的部分,让我意识到单打独斗是不够的,必须要建立更多的合作关系。
482分钟前
头像
什么应用攻略
文章非常有帮助,提升了我的网站流量。
597分钟前
二维码