...

百度悶聲幹大事(shì)

2022-01-20

進(jìn)入到 2022 年,生物科技領域,動态不斷。

僅過(guò)半個月,有 4 家生物科技相關公司被同一家企業投資;不僅如此,它所投的項目在《麻省理工科技評論》(MIT Tech Review )的十大突破性發(fā)明“AI 新藥發(fā)現”闆塊占比過(guò)半……

這(zhè)些動态的背後(hòu),都(dōu)離不開(kāi)一家互聯網巨頭:百度。

對(duì)于鮮少關注醫學(xué)領域的人來說(shuō),很難將(jiāng)百度和生命科學(xué)進(jìn)行聯系,但從其近年來的種(zhǒng)種(zhǒng)舉措來看,在生命科學(xué)領域,百度正“悶聲幹大事(shì)”。

百度 AI 落地的另一站

對(duì)外界而言,百度 AI 落地最廣爲人知的場景在于自動駕駛領域,即百度 Apollo,但對(duì)于百度而言,其 AI 的野心并不止于此——對(duì)于生命科學(xué)領域,百度同樣想吃下;不僅因爲這(zhè)是一個極具前沿性的方向(xiàng),而且關系到李彥宏“最初的夢想”。

大約在 20-25 年前,李彥宏就(jiù)對(duì)生物信息學(xué)挖掘人體秘密充滿興趣。

早在 90 年代,李彥宏在華爾街時(shí)便申請過(guò)生物信息研究相關的工作,據說(shuō)當時(shí)已經(jīng)拿到世界頂尖生命科學(xué)研究機構的 Merck(默克集團)的 offer。

不過(guò),在他看來,當時(shí)的基因測序技術還(hái)非常初級,生物數據量和數據質量也不足以發(fā)揮計算的優勢。

“如果那麼(me)多從事(shì)生命科學(xué)的人都(dōu)不相信計算機能(néng)夠對(duì)生命科學(xué)産生重要影響,那麼(me)靠我一個人力量恐怕也很難推動”,李彥宏事(shì)後(hòu)回憶。

後(hòu)來的事(shì)情也不難得知,李彥宏回國(guó)創立了百度,而後(hòu)百度又在 AI 上迅猛發(fā)力,并在包括智能(néng)駕駛等領域進(jìn)行落地實踐。

但對(duì)李彥宏來說(shuō),他始終沒(méi)有放下對(duì)生命科學(xué)的向(xiàng)往。李彥宏曾多次在公開(kāi)場合提到計算機技術與生命科學(xué)相結合的可能(néng)性。

在他看來,基因測序是 IT 領域之外另一個高度契合摩爾定律的領域。“每隔 18 個月,計算機的計算能(néng)力提升一倍、成(chéng)本下降了一半,經(jīng)過(guò)幾十年這(zhè)樣的速度發(fā)展,很多原來覺得不可能(néng)的事(shì)情變可能(néng)了”,李彥宏表示。

從基因測序的發(fā)展來看,的确如此。十幾年前,基因測序需要花費 10 億、20 億才做出來。如今,每個人的基因測序隻需花費 1000 美元左右。

即使當初想投身聲明科學(xué)的“夢”被暫時(shí)擱置,但在很長(cháng)一段時(shí)間裡(lǐ),李彥宏一直在嘗試推動互聯網技術和生命科學(xué)的結合,曾個人捐資 3000 萬元與協和合作抗癌項目;跨界參與完成(chéng)醫學(xué)研究論文等。

2020 年 5 月,李彥宏與其它學(xué)者共同研究的關于食管鱗狀細胞癌的論文在權威醫學(xué)期刊 Cell Research 雜志發(fā)表,題爲《Whole-genome sequencing of 508 patients identifies key molecular features associated with poor prognosis in esophageal squamous cell carcinoma》。

除了李彥宏親自上陣的種(zhǒng)種(zhǒng)舉措,百度還(hái)在内部設立了一家 VC 基金——百度風投(Baidu Ventures),其中一大重要投資版塊便是生物智能(néng)。

據不完全統計,百度風投過(guò)往投資的生物計算相關企業超過(guò) 50 家,涵蓋 AI 藥物發(fā)現、多組學(xué)數據、分子影像等諸多領域。

在多年的積累沉澱下,百度在 2020 年 1 月疫情爆發(fā)時(shí)就(jiù)能(néng)夠在第一時(shí)間開(kāi)放線性時(shí)間算法 LinearFold——借助這(zhè)一算法,疾控部門用 10 小時(shí)便完成(chéng)了四個樣本的全基因組測序。

随後(hòu),百度研究院又推出全球首個專門優化新冠病毒 mRNA 疫苗基因序列的高效算法 LinearDesign,可在 11 分鍾内完成(chéng)序列設計。

或許是新冠疫情的爆發(fā)讓百度更加認識到互聯網技術和生命科學(xué)結合的重要性,在 2020 年 8 月,百度研究院宣布成(chéng)立生物計算實驗室。

百度期望通過(guò) AI 和計算技術,深化學(xué)術界和生物制藥企業的合作,探索基因、DNA、RNA、蛋白質分子結構等人類生命密碼,縮短新藥研發(fā)周期,降低新藥研發(fā)成(chéng)本,提升藥物和疾病匹配的精準度,發(fā)現基因和疾病的關聯關系,從而實現精準醫療。

僅僅過(guò)了 1 個月,百度就(jiù)成(chéng)立了一家名爲 "百圖生科"(英文簡稱爲 BioMap)的生命科學(xué)平台公司——李彥宏作爲牽頭發(fā)起(qǐ)人,擔任該公司的董事(shì)長(cháng),原百度風投 CEO 劉維擔任 CEO。

百度悶聲幹大事(shì)

雷峰網注:圖爲劉維

值得注意的是,百圖生科成(chéng)立初期,李彥宏并未以個人股東的身份出現。直到 2021 年 3 月,李彥宏才通過(guò)直接和間接方式持有百圖生科 40% 股份,成(chéng)爲名副其實的幕後(hòu)掌舵人。

這(zhè)意味著(zhe),在紮根互聯網 20 年後(hòu),百度正式向(xiàng)生物科學(xué)進(jìn)軍,尋求 AI 落地的另一站,而李彥宏也重新踏上了逐夢之旅。

步入無人區

“這(zhè)些年,我對(duì)挖掘人體數據、探尋疾病規律、找到新藥設計的熱情一如既往”,在 2021 年的生物計算大會(huì)上,李彥宏坦言一直在密切關注生物計算行業的變化。

盡管 20 多年前未能(néng)圓夢,但随著(zhe)生物計算發(fā)展十分迅速,産生的大量數據(包括基因組學(xué)研究帶來的人體數據、新藥研發(fā)過(guò)程當中所累積的知識、以及新生的各類機器學(xué)習算法等)爲認知複雜的生命系統打開(kāi)了新的大門,也給計算技術帶來了新的用武之地。

知名咨詢公司埃森哲(Accenture)曾在預測報告中指出——到 2026 年,大數據與醫學(xué)和制藥領域的機器學(xué)習相結合將(jiāng)産生每年 1500 億美元的驚人價值。

可見,生物計算是一個前景遼闊的領地。李彥宏也堅定認爲,生物和計算的融合會(huì)帶來巨大的突破和進(jìn)步。因此,百圖生科的業務發(fā)展規劃也始終圍繞這(zhè)個核心展開(kāi)。

雷峰網了解到,百圖生科的業務發(fā)展分爲兩(liǎng)個階段——

  • 第一個階段:利用前沿 AI 技術構建完整的生物計算平台,并與提供新的數據軸和新的數據分析、藥物設計工具的初創企業與研究機構攜手,構建生物計算生态,爲生命科學(xué)企業和科研用戶提供豐富的工具能(néng)力和完整的解決方案,做好(hǎo)服務。

  • 第二個階段:深度參與或主導發(fā)起(qǐ)新型精準藥物和精準診斷産品的研發(fā),攜手合作夥伴,爲社會(huì)貢獻極具創新性的精準生命科學(xué)産品。

不僅如此,百圖生科還(hái)計劃大力投入關鍵底層數據設備和計算技術的研發(fā),加速高通量類器官芯片、高分辨物質觀測設備、新的組學(xué)采集分析設備、蛋白質模拟和生物計算專用芯片的研發(fā)。

這(zhè)并非易事(shì)。

僅是 AI 制藥,就(jiù)需要突破三大技術門檻,包括高性能(néng)的生物計算引擎、幹濕一體的生物數據生産能(néng)力、靶點挖掘 — 藥物設計全流程的閉環能(néng)力。

“這(zhè)是一個新興的行業,沒(méi)有一個成(chéng)熟的解決方案可以直接套用”,百圖生科首席 AI 科學(xué)家宋樂說(shuō)道(dào)。

宋樂進(jìn)一步向(xiàng)雷峰網解釋道(dào),要用 AI 發(fā)掘新藥有三個問題需要提前考慮:

  • 一是了解複雜疾病的困難。

  • 二是對(duì)多維度、多尺度的數據進(jìn)行複雜且多樣化的融合處理,包括基因層面(miàn)的基因測序、表觀組,蛋白質表達、蛋白質代謝,組織層面(miàn)、機理層面(miàn)等。

  • 三是行業配合問題。數據分析與實驗往往是兩(liǎng)波人,他們之間的溝通缺乏一個非常高效的系統,將(jiāng)預測、模型輸出和試驗系統進(jìn)行整合。

不難想見,即使背靠百度這(zhè)座大山,百圖生科依然步履維艱;畢竟,其要駛入的,是一片無人區。

而百圖生科,僅剛剛開(kāi)始。

沒(méi)有盡頭的投注

公開(kāi)資料顯示,百圖生科將(jiāng)與百度底層深度學(xué)習算法平台飛槳建立深度戰略合作,飛槳將(jiāng)爲百圖生科提供 AI 底層技術和開(kāi)發(fā)工具。同時(shí),百度作爲善于處理海量數據、知識圖譜,具有巨型數據中心布局的 AI 平台公司,預計也將(jiāng)在底層架構上與百圖生科産生協同。

從全球市場來看,企業耗費巨資建立研發(fā)中心的大研發(fā)模式已成(chéng)過(guò)去。近年流行的趨勢是 VIC 模式,即 “VC (風險投資) +IP (知識産權) +CRO (研發(fā)外包服務)” 相結合的新藥研發(fā)模式。

在此模式之上,百圖生科提出了“VIP”模式,即利用資本(Venture)+自行參與打造 IP + 生物計算及智能(néng)實驗平台(Platform)加速藥物和診斷管線的 IP 生成(chéng)和轉化——這(zhè)或將(jiāng)成(chéng)爲百圖生科生物計算平台的核心價值和盈利來源。

雷峰網了解到,百圖生科有獨立的投資部門 BioMap Ventures,其前身是百度風投的生物投資團隊,目前在全球已投資了超過(guò) 50 家早期企業。

百度悶聲幹大事(shì)

除了聯合生态合作夥伴,百圖生科還(hái)在不斷招兵買馬。成(chéng)立初期,百圖生科就(jiù)宣布兩(liǎng)項領軍人才招募計劃,將(jiāng)分别用 100 萬美元年薪及 100 萬人民币年薪招兵買馬。

值得一提的是,去年加入百圖生科擔任首席 AI 科學(xué)家宋樂就(jiù)是世界知名的機器學(xué)習專家,他曾在 CMU 從事(shì)生物計算相關的研究,利用機器學(xué)習技術對(duì)靶點挖掘、藥物設計取得了一系列突破性成(chéng)果,獲得 NeurIPS、ICML、AISTATS 等主要機器學(xué)習會(huì)議的最佳論文獎。

2021 年 5 月,百圖生科還(hái)推出了“免疫圖譜卓越計劃”。百圖生科提供自身研發(fā)的核心生物計算引擎、海量自有數據、10 億元的資金補貼,與生态聯盟合作夥伴共同推動免疫圖譜的繪制,系統探尋癌症、自免等疾病的複雜免疫規律,進(jìn)一步提高對(duì)應的靶點挖掘和藥物設計效率。

截至 2020 年 7 月底,首批“卓越計劃”就(jiù)已收到來自中科院、協和、北大、清華、複旦等系統的近百個臨床和研究團隊的申報。

不僅如此,百圖生科目前也在自建實驗室,從而全流程系統化地解決和提高行業的運行效率。

據悉,通過(guò)利用自己構建的生物計算平台和大規模預訓練模型,百圖生科成(chéng)功將(jiāng)典型蛋白質結構預測時(shí)間,從 30 分鍾縮短到 5 分鍾以内。

在不斷地發(fā)展布局下,百圖生科在去年 7 月拿到了上億美元 A 輪融資,GGV 紀源資本領投,百度、君聯資本、藍馳創投、真知資本、襄禾資本跟投。據了解,這(zhè)輪融資還(hái)將(jiāng)用于技術研發(fā)和人才引進(jìn)。

如果僅從百圖生科的成(chéng)立到發(fā)展的周期來看,其時(shí)間長(cháng)度僅一年有餘,但實際上,百圖生科其實是李彥宏和百度在生命科學(xué)領域多年積累的彙聚,是百度 AI 落地的另一站,也是百度開(kāi)啓生物計算的新通道(dào)。

這(zhè)是一條道(dào)阻且長(cháng)的道(dào)路,李彥宏同樣深知,他表示——

“生命科學(xué)沒(méi)有盡頭,隻有盡力”。


來源:雷鋒網