欧美福利在线观看,国产精品区一区二区免费,国产精品久久久久久久免费,91精品一区二区综合在线

離職工程師長文復盤:為什么OpenAI總能誕生偉大產品?slack

作者: 小李 2025-07-18 12:19:00
閱讀(16)
來自微信公眾號:劃重點KeyPoints,編譯:重點君,頭圖來自:AI生成從掀起新一輪科技浪潮的ChatGPT,到DALL·E、Whisper、Sora、Codex,很多人好奇,為什么OpenAI總能誕生改變世界的偉大產品?三周前,OpenAI資深工程師CalvinFrench-Owen宣布離職,他是Codex項目的核心成員之一,Codex是OpenAI的新型編程助手,競爭對手包括Cursor和Anthropic的ClaudeCode。離開后,Calvin寫了一份長長的內部回憶,從一線工程師的角度,給所有好奇OpenAI的人揭秘了這個組織內部的真實情況。在他眼里,OpenAI是一個非常復雜的存在:既像研究實驗室,更像一臺永不停歇的產品機器。OpenAI一年,從一千人暴增到三千人在加入OpenAI時,Calvin是第1000多個員工,一年后,公司規模翻了三倍。他在博客里寫道,這種飛速擴張帶來了典型的“成長的煩惱”:組織溝通混亂、團隊節奏各異、Slack消息轟炸一切。OpenAI內部幾乎不用郵件,所有溝通都在Slack上完成。沒有人會管你怎么用,只要你能跟上節奏。他形容自己從Segment的小團隊創始人身份,切換到3000人組織里的一顆螺絲釘,這種落差感讓他一度懷疑自己的決定。但這段時間,也讓他看見了一個“巨型科研與產品工廠”是怎么運轉的。自下而上,一切都能自己先干起來Calvin反復提到一個詞:自下而上。在OpenAI,好點子往往不是靠流程生出來的,而是哪個人先偷偷動手做了個原型。當時Codex的原型,內部一度有3-4個版本同時流傳,都是幾個人自己攢出來的。等到效果好,就能拉人、組隊、立項。管理也和傳統巨頭不太一樣:誰能想出好點子、能做出來,誰就能在團隊里獲得更高的話語權。相比演講和政治手腕,這家公司更看重“你能不能把東西做出來”。他甚至說,最好的研究員都像是“小型CEO”,他們對自己手頭的研究有完全的自主權,沒人會管你要做什么,只看結果。迅速行動,Codex僅七周就上線Calvin在這封備忘錄里最鮮活的部分,來自Codex沖刺的7周。他提前結束了陪產假,又回到辦公室,和十幾個人拼了命地打磨產品、測試功能、改代碼。他寫道:“這是我近十年來最累的七周。每天晚上十一二點回家,清晨五點半又被孩子叫醒,七點重新坐進辦公室,周末也在趕工。”從第一行代碼到上線,Codex只用了7周。在這背后,是一個不到20人的核心團隊,外加隨時拉來的ChatGPT工程師、設計、產品經理、市場。沒有多余的扯皮,沒有季度OKR,誰能上就直接上。他說自己從沒見過哪家公司能在這么短的時間里把一個idea變成產品,還免費開放給所有人用——這就是OpenAI最真實的工作節奏。被放大的注目與隱形的壓力這家公司的野心遠不止ChatGPT。Calvin爆料,OpenAI同時在十幾個方向上下注:API、生圖、編碼代理、硬件、甚至還有沒對外公布的項目。他也看見了這背后不可避免的高壓。幾乎所有團隊都在追趕同一個目標:打造通用人工智能(AGI)。他們的每一條Slack消息,都可能會被全球放大成新聞。內部很多產品和收入數據嚴防死守,團隊里有不同的權限區隔。外界討論的安全問題,Calvin也有他的觀察。他說,真正讓大多數團隊日夜擔心的,并不是“AI什么時候掌控世界”,而是仇恨言論、政治操縱、提示注入、或者用戶拿它來寫生物武器配方。這些現實的、不起眼的風險,遠比哲學問題更棘手。OpenAI到底酷在哪兒?在外人看來,這家公司是“離人類終極智能最近的地方”。在離開的人眼里,酷的地方恰恰是:它仍然沒變成一個遲鈍的巨頭。Codex項目用7周上線,團隊可以隨時跨項目調人,“只要有用,就別等下個季度計劃”。領導層天天泡在Slack里,不是象征性露面,而是真的參與具體討論和決策。還有一點讓他很服氣:OpenAI把最強大的模型免費放到API里,不僅賣給大企業,也給普通人用,不用簽年度協議,也不用交昂貴授權費。這點,他們算是說到做到。他離開的原因,也沒那么戲劇化。外界總愛把離職放大成陰謀。Calvin卻說,離開OpenAI70%只是因為他想重新做點自己的事。在他眼里,OpenAI已經從一群科學怪人做實驗室,變成了一個混合體:一半是科研,一半是消費級應用的產品機器,不同團隊有不同目標和節奏。而他需要新的探索。最后這封信留給外界的,是一份旁觀者視角的提醒:OpenAI不是冷冰冰的AGI工廠,而是一群人,用一套近乎極限的速度,把腦子里的點子變成全世界用得上的產品。他寫道:“哪怕只是站在這臺巨型機器里的一顆小螺絲釘,也足夠讓人清醒,也足夠讓人興奮。”這段話或許就是所有離開、留下,或者正好奇著OpenAI的人,都會懂的一句話。以下為Calvin分享原文(由GPT翻譯):關于OpenAI的思考2025年7月15日我三周前離開了OpenAI。我是在2024年5月加入這家公司的。我想分享我的一些感想,因為圍繞OpenAI的所作所為有很多煙霧彈和噪音,但關于在那里工作的文化實際感受卻鮮有第一手的描述。納比爾·奎雷希有一篇精彩的文章《對Palantir的反思》,他在文中深思了Palantir的獨特之處。我也想趁記憶猶新時,對OpenAI做同樣的反思。這里沒有任何商業機密,更多的是對這個歷史上最引人入勝的組織之一在極其有趣時期的現狀的一些感想。離職工程師長文復盤:為什么OpenAI總能誕生偉大產品?slack先說明一下:我離開的決定中沒有任何個人恩怨——事實上我對此感到非常矛盾。從自己創辦的項目轉變為一家擁有3000名員工的組織中的一員,這種轉變很難。現在我渴望一個新的開始。完全有可能是工作的質量會吸引我回去。很難想象能打造出像AGI那樣有深遠影響的東西,而LLMs無疑是本十年的技術創新。我很幸運能親眼見證一些發展,并且參與了Codex的發布。顯然,這些并非公司的觀點——作為觀察,這是我個人的看法。OpenAI是一個大平臺,這只是我對它的一扇小窗。文化關于OpenAI,首先要了解的是它的快速成長。當我加入時,公司員工剛剛超過1000人。一年后,人數已超過3000,而我在任職時間上位于前30%。幾乎所有領導層成員的工作內容與2-3年前截然不同。當然,快速擴張帶來了各種問題:如何作為一個公司進行溝通,匯報結構,產品發布流程,人員管理與組織,招聘流程等等。各團隊文化差異顯著:有些團隊一直全速沖刺,有些則在監控大型項目運行,還有些保持著更為穩定的節奏。沒有單一的OpenAI體驗,研究、應用和市場推廣部門的時間節奏也大相徑庭。OpenAI的一個特殊之處在于,所有一切——我指的是所有——都依賴Slack進行。沒有電子郵件。在我整個任職期間,收到的郵件大約只有10封。如果你不善于組織,這會讓你感到極度分心。但如果你能合理管理頻道和通知,使用起來還是相當可行的。OpenAI在研究方面尤其注重自下而上的方式。當我剛加入時,我開始詢問下一季度的路線圖。得到的回答是:“這并不存在”(雖然現在有了)。好點子可以來自任何地方,而且通常很難提前判斷哪些點子會最有成效。與其說有一個宏大的“總體規劃”,不如說進展是迭代的,隨著新研究成果的出現逐步顯現。正因為這種自下而上的文化,OpenAI也非常重視能力和貢獻。公司歷來的領導者主要是基于他們提出好點子并付諸實施的能力而晉升。許多非常有能力的領導者在全員大會上的演講或政治手腕方面并不擅長。在OpenAI,這些方面的重要性遠不如其他公司。最好的點子往往會勝出。有一種強烈的行動偏向(你可以直接去做事情)。類似的團隊,雖然彼此無關,卻經常會在各種想法上不謀而合。我最初參與了一個與ChatGPT連接器類似的平行(但內部)項目。在我們決定推動發布之前,可能有大約3-4個不同的Codex原型在流傳。這些工作通常由少數幾個人在未獲許可的情況下自行開展。隨著項目展現出潛力,團隊往往會迅速圍繞它們組建起來。Andrey(Codex負責人)曾告訴我,你應該把研究人員看作他們自己的“小型高管”。有一種強烈的傾向是專注于自己的事情,看看結果如何。這里有一個推論——大多數研究都是通過“極客誘導”研究人員專注于某個特定問題來完成的。如果某個問題被認為無聊或“已解決”,它很可能不會被繼續研究。優秀的研究經理極具影響力,但同時也非常有限。最出色的經理能夠連接許多不同的研究工作,匯聚成更大的模型訓練。同樣的道理也適用于出色的產品經理(向ae致敬)。我合作過的ChatGPT產品經理(Akshay、Rizzo、Sulman)是我見過的最酷的客戶之一。感覺他們幾乎已經見識過一切。他們大多相對放手,但都聘用了優秀的人才,并努力確保他們能夠取得成功。OpenAI能夠迅速調整方向。這是我們在Segment非常重視的一點——隨著新信息的出現,做正確的事遠比僅僅因為有計劃而堅持原路更好。令人驚訝的是,像OpenAI這樣規模龐大的公司依然保持著這種精神——而谷歌顯然沒有。公司決策迅速,一旦決定追求某個方向,就全力以赴。公司面臨著大量的審視。作為來自B2B企業背景的人,這讓我有些震驚。我經常看到新聞媒體爆出尚未在內部宣布的消息。當我告訴別人我在OpenAI工作時,常常會遇到對公司已有的既定看法。一些Twitter用戶運行自動機器人,檢查是否有新功能即將發布。因此,OpenAI是一個非常保密的地方。我不能向任何人詳細透露我正在做的工作。這里有幾個擁有不同權限的Slack工作區。收入和資金消耗數據則被更加嚴格地保密。OpenAI也是一個比你想象中更嚴肅的地方,部分原因是因為風險感非常高。一方面,目標是構建通用人工智能(AGI)——這意味著有很多事情必須做到位。另一方面,你正在打造一個產品,數億用戶依賴它來獲取從醫療建議到心理治療的各種服務。再另一方面,公司正參與全球最大的競爭舞臺。我們會密切關注Meta、谷歌和Anthropic的動態——我相信他們也在做同樣的事情。所有主要國家政府都在密切關注這一領域。盡管OpenAI經常在媒體上受到詆毀,但我遇到的每個人實際上都在努力做正確的事。鑒于其面向消費者的定位,它是大型實驗室中最為顯眼的,因此也承受了大量的誹謗。話雖如此,你大概不應該把OpenAI看作一個單一的整體。我認為OpenAI起初像洛斯阿拉莫斯實驗室一樣,是一群科學家和技術愛好者在探索科學前沿。這個團隊偶然間催生了史上最具病毒傳播性的消費級應用。隨后,它的發展目標擴展到了向政府和企業銷售。組織中不同資歷和不同部門的人,隨后有了截然不同的目標和觀點。你在那里的時間越長,越可能通過“研究實驗室”或“為公益服務的非營利機構”的視角來看待事情。我最欣賞這家公司的一點是,它在分配人工智能利益方面“言行一致”。最先進的模型并不局限于某個需要年度協議的企業級別。世界上任何人都可以直接使用ChatGPT獲取答案,即使沒有登錄。你可以注冊并使用API——大多數模型(即使是最先進或專有的)通常也會很快進入API,供初創企業使用。你可以想象一種與我們今天所處的體系截然不同的運作模式。OpenAI為此應當獲得大量贊譽,這仍然是公司核心的基因。安全性實際上比你從Zvi或Lesswrong等大量閱讀中猜測的要重要得多。有大量人員致力于開發安全系統。鑒于OpenAI的性質,我看到更多關注的是實際風險(仇恨言論、濫用、操縱政治偏見、制造生物武器、自殘、提示注入)而非理論風險(智能爆炸、權力尋求)。這并不是說沒人關注后者,確實有人專注于理論風險。但從我的角度來看,這并不是重點。大部分工作沒有公開發表,OpenAI確實應該做更多工作來發布這些內容。與其他公司在每次招聘會隨意發放周邊不同,OpenAI幾乎不發放周邊(即使是給新員工)。取而代之的是“限時發售”,你可以訂購有現貨的商品。第一次發售時,需求量大到導致Shopify商店癱瘓。內部還流傳著一篇帖子,講解如何正確POSTJSON數據包以繞過限制。與GPU成本相比,幾乎所有其他開銷都微不足道。舉個例子:作為Codex產品一部分開發的一個小眾功能,其GPU成本與我們整個Segment基礎設施的GPU成本相當(雖然規模不及ChatGPT,但也承擔了相當一部分互聯網流量)。OpenAI可能是我見過的最令人畏懼的雄心勃勃的組織。你可能會認為擁有全球頂級的消費級應用之一已經足夠了,但他們渴望在數十個領域展開競爭:API產品、深度研究、硬件、編碼代理、圖像生成,以及一些尚未公布的領域。這是一個孕育并推動創意不斷前進的沃土。公司非常關注推特。如果你發了一條與OpenAI相關且廣為傳播的推文,很可能有人會看到并加以考慮。我的一個朋友開玩笑說:“這家公司靠推特氛圍運轉。”作為一家面向消費者的公司,這說法或許并不完全錯誤。雖然他們確實還在大量分析使用情況、用戶增長和留存率,但氛圍同樣重要。OpenAI的團隊比其他地方更加靈活。在推出Codex時,我們需要幾位有經驗的ChatGPT工程師的幫助以趕上發布日期。我們與一些ChatGPT的工程經理會面提出請求。第二天,就有兩位非常厲害的人準備投入并提供幫助。沒有“等待季度計劃”或“重新調整人員編制”的繁瑣過程,進展非常迅速。領導層非常顯眼且深度參與。在像OpenAI這樣的公司,這或許很明顯,但每位高管似乎都非常投入。你會經常在Slack上看到gdb、sama、kw、mark、dane等人積極發言。沒有缺席的領導者。代碼OpenAI使用一個龐大的單一代碼庫,主要是Python(盡管也有越來越多的Rust服務和少量用于網絡代理等的Golang服務)。這導致代碼風格多樣,因為Python有很多不同的寫法。你會遇到既有來自擁有十年經驗的谷歌老兵設計的可擴展庫,也有剛畢業博士寫的臨時Jupyter筆記本。幾乎所有東西都圍繞FastAPI來創建API,使用Pydantic進行驗證。但整體上并沒有強制執行統一的代碼風格指南。OpenAI的所有服務都運行在Azure上。有趣的是,我認為只有三項服務是值得信賴的:AzureKubernetes服務、CosmosDB(Azure的文檔存儲)和BlobStore。沒有真正等同于Dynamo、Spanner、Bigtable、BigQuery、Kinesis或Aurora的服務。自動擴展單元的思維方式也較為罕見。IAM的實現通常遠不如AWS那樣完善,而且有很強的內部開發傾向。在人員方面(至少在工程領域),Meta到OpenAI的人才流動非常顯著。在許多方面,OpenAI類似于早期的Meta:一個爆款的消費級應用、初步的基礎設施,以及快速發展的渴望。我見過從Meta和Instagram轉過來的大多數基礎設施人才都非常優秀。將這些因素結合起來,你會發現許多基礎設施的核心部分讓人聯想到Meta。離職工程師長文復盤:為什么OpenAI總能誕生偉大產品?slack內部重新實現了TAO,努力在邊緣整合身份認證,我相信還有許多我不了解的其他項目。聊天的概念非常深入。自從ChatGPT走紅以來,很多代碼庫的結構都是圍繞聊天消息和對話的理念構建的。這些基本元素已經深深植入其中,忽視它們可能會帶來風險。我們在Codex中稍有偏離(更多借鑒了響應API的經驗),但仍然利用了大量已有的技術成果。代碼取勝。與其依賴某個中央架構或規劃委員會,決策通常由計劃執行工作的團隊做出。結果是行動導向非常強烈,代碼庫中常常存在多個重復的部分。我大概見過半打左右的隊列管理或代理循環相關的庫。在幾個方面,快速擴展的工程團隊和缺乏工具帶來了問題。sa-server(后端單體應用)成了一個有些雜亂的地方。主分支上的持續集成(CI)故障比預期頻繁得多。即使測試用例并行運行,并且只考慮部分依賴,使用GPU運行也可能需要大約30分鐘。這些問題并非無法解決,但這提醒我們,這類問題無處不在,而且在快速擴展時可能會變得更嚴重。值得肯定的是,內部團隊正高度重視并致力于改進這一狀況。我學到的其他東西這就是大型消費品牌的樣子。在我們開始開發Codex之前,我并沒有真正意識到這一點。所有的衡量標準都是以“專業用戶”為單位。即使是像Codex這樣的產品,我們也主要考慮個人使用的入門體驗,而不是團隊使用。作為一個主要來自B2B/企業背景的人,這讓我有些難以適應。你只需一開關,流量從第一天起就會涌入。大型模型的訓練(高層次概述)。從“實驗”到“工程”存在一個光譜。大多數想法最初都是小規模實驗。如果結果看起來有希望,它們會被納入更大規模的訓練中。實驗不僅涉及調整核心算法,還包括調整數據組合并仔細研究結果。在大規模訓練方面,幾乎看起來像是巨型分布式系統工程。會遇到各種奇怪的邊緣情況和意想不到的問題,調試這些問題的責任就在于你。如何進行GPU計算。作為Codex發布的一部分,我們必須預測負載容量需求,而這也是我第一次真正花時間對GPU進行基準測試。關鍵是你應該從所需的延遲要求入手(整體延遲、令牌數量、首個令牌時間),而不是從底層分析GPU能支持的性能開始。每一次新模型的迭代都可能極大地改變負載模式。如何在大型Python代碼庫中工作。Segment結合了微服務,主要使用Golang和Typescript。我們沒有OpenAI那樣龐大的代碼量。我學到了很多關于如何根據開發者數量來擴展代碼庫的經驗。你必須為“默認可用”、“保持主分支干凈”和“難以誤用”等方面設置更多的保護措施。發布Codex我在OpenAI的最后三個月中,很大一部分時間都投入到了Codex的發布。這無疑是我職業生涯中的一個重要亮點。背景介紹:早在2024年11月,OpenAI就設定了2025年推出編程代理的目標。到了2025年2月,我們內部已有一些利用模型取得顯著效果的工具在運行。我們感受到了推出專門針對編程的代理的壓力。顯然,模型已經發展到對編程非常有用的階段(市場上新興的各種編程輔助工具的爆發即是明證)。我提前結束了陪產假,回去協助參與Codex的發布。一周后,我們經歷了兩個團隊(略顯混亂的)合并,隨后開始了瘋狂的沖刺。從最初編寫第一行代碼到完成,整個產品僅用了7周時間。Codex沖刺可能是我近十年來最努力的一次。大多數晚上都工作到十一點或午夜。每天早上五點半被新生兒叫醒。七點又去辦公室。大多數周末也在工作。我們作為一個團隊全力以赴,因為每一周都至關重要。這讓我想起了在YCombinator的時光。這種速度之快,難以用言語形容。我從未見過無論大小的組織能在如此短的時間內,從一個想法發展到完全發布且免費提供的產品。范圍也不小;我們構建了一個容器運行時,優化了代碼庫下載,微調了一個定制模型以處理代碼編輯,處理了各種git操作,引入了全新的界面,啟用了互聯網訪問,最終打造出一個使用起來非常愉快的產品。不管你怎么說,OpenAI依然保持著那種開拓精神。好消息是,合適的人才能創造奇跡。我們是一個由大約8名工程師、4名研究員、2名設計師、2名市場推廣人員和1名產品經理組成的高級團隊。如果沒有這支團隊,我想我們早就失敗了。沒人需要太多指導,但確實需要相當多的協調。如果你有機會與Codex團隊的任何人合作,請知道他們每一個人都非常出色。發布前一晚,我們五個人熬夜到凌晨4點,試圖部署主單體系統(這是一個耗時數小時的過程)。然后我們又回到辦公室,準備上午8點的發布公告和直播。我們開啟了功能開關,開始看到流量涌入。我從未見過一個產品僅僅出現在左側邊欄就能獲得如此迅速的增長,但這就是ChatGPT的力量。在產品形態方面,我們最終確定了一種完全異步的形式。與當時的Cursor(現在也支持類似模式)或ClaudeCode等工具不同,我們的目標是讓用戶能夠啟動任務,讓代理在自己的環境中運行。我們的賭注是在最終階段,用戶應該像對待同事一樣對待編碼代理:他們向代理發送信息,代理有時間完成工作,然后帶著一個PR回來。這有點像一場賭博:我們現在處于一個有些奇怪的狀態,模型表現不錯,但還不算出色。它們可以連續工作幾分鐘,但還不能持續幾個小時。用戶對模型能力的信任程度差異很大。而且我們甚至還不清楚模型的真正能力到底有多強。從長遠來看,我確實相信大多數編程將更像Codex。同時,觀察所有產品如何展開將會非常有趣。Codex(也許并不令人意外)非常擅長在大型代碼庫中工作,理解如何導航。與其他工具相比,我見過的最大區別是它能夠同時啟動多個任務并比較它們的輸出。我最近看到有公開數據比較了不同LLM代理提交的PR數量。僅從公開數據來看,Codex已經生成了63萬個PR。自發布以來的53天內,平均每位工程師提交了約7.8萬個公開PR(你可以自行推測私有PR的倍數)。我不確定我這輩子是否曾參與過如此有影響力的項目。離別感言說實話,我最初對加入OpenAI感到有些擔憂。我不確定放棄自由、接受上司管理、成為龐大機器中一個微小部分的感覺會是怎樣。我一直低調地保密自己加入了,萬一不合適的話。我確實想從這次經歷中獲得三樣東西:1、建立對模型訓練方式及其能力發展方向的直覺理解;2、與杰出人才共事并學習;3、推出一款偉大的產品。回顧這一年,我認為這是我做過的最明智的決定之一。很難想象在別處還能學到更多。如果你是創始人,感覺你的初創公司真的沒有什么進展,你應該要么深入重新評估如何增加更多嘗試機會;要么去加入一家大型實驗室。現在是一個極佳的創業時機,同時也是洞察未來走向的絕佳時刻。在我看來,通向通用人工智能(AGI)的道路目前是一場三馬爭霸:OpenAI、Anthropic和谷歌。每個組織都會根據自身的基因(面向消費者、面向企業、堅實的基礎設施加數據)走不同的路徑。在其中任何一家工作都會是一次開闊眼界的經歷。感謝Leah在深夜時分給予極大的支持并承擔了大部分育兒工作。感謝PW、GDB和Rizzo給我這個機會。感謝SA團隊的成員教我入門:Andrew、Anup、Bill、Kwaz、Ming、Simon、Tony和Val。還要感謝Codex核心團隊帶我經歷了人生難忘的旅程:Albin、AE、Andrey、Bryan、Channing、DavidK、Gabe、Gladstone、Hanson、Joey、Josh、Katy、KevinT、Max、Sabrina、SQ、Tibo、TZ和Will。我永遠不會忘記這次沖刺。每當有領導離職時,人們很容易去解讀各種戲劇性事件,但我認為其中大約70%的原因僅僅是這個事實。我確實認為我們正處于一個輕微的階段性變化。公司正在從外部大量招聘高級領導。我總體上支持這一點,我認為公司從注入新的外部基因中受益匪淺。我感覺,擴展有史以來增長最快的C端產品往往會鍛煉出強大的實力。當然,我們也是站在巨人的肩膀上。CaaS團隊、核心強化學習團隊、人類數據和通用應用基礎設施使這一切成為可能。我們也一直在堅持。幾周前我們看到Meta有一些重要的招聘。xAI推出了在基準測試中表現出色的Grok4。Mira和Ilya都有很強的才華。也許這會改變局面(這些人很優秀)。他們還有一些需要趕上的地方。原文鏈接:https://calv.info/openai-reflections本文來自微信公眾號:劃重點KeyPoints,編譯:重點君本內容為作者獨立觀點,不代表虎嗅立場。未經允許不得轉載,授權事宜請聯系hezuo@huxiu.com本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4587802.html?f=wyxwapp