

从 AlphaFold 精确揣测卵白质三维结构,到大谈话模子理解复杂的基因组语法。在往常的几年里,东谈主工智能在人命科学畛域的冲破令东谈主顾惜。然则,在合成生物学和精确医疗畛域,除了“阅读”和“揣测”人命密码,要害还在于“改写”与“精确限度”。如若咱们能像调遣音量旋钮通常,在特定的细胞内极其精确地限度某个基因的抒发剂量,疾病诊治将迎来更高阶的冲破。
而基因抒发调控元件恰是搞定这一难题的要害。它被视为天然界赋予细胞的“开关与旋钮”,编码时空特异性逻辑,确保基因在正确的时刻、正确的细胞中以顺应强度开启。始终以来,细胞与基因疗法的安全性瓶颈正源于咱们对这些元件的限度不及:传统联想格式多依赖叠加已知基序或立地拼接,既难以获取可靠候选分子,也难以结束贯穿梯度调控。
3 月 13 日,Y Combinator 援助的 AI 生物本领初创公司 Origin Bio 书记,向大家科研社区开源 10,000 条填塞由 AI 联想生成的近端增强子样序列(proximal enhancer-like sequences, pELS),并同步上线免费平台 Switch。这将为大畛域平行讲演基因分析(MPRA)等功能性实践提供海量的数据储备,有望为传统的扰动生物学(Perturbation Biology)注入全新的 AI 协调机制。
公司仅 4 东谈主,专注 AI 驱动的调控 DNA 联想
Origin Bio 斥地于 2025 年,总部位于旧金山,近期已入选 Y Combinator Winter 2026 批次,团队畛域极小,仅有 4 东谈主。CEO 亚什·拉托德(Yash Rathod)与 CTO 马尔哈·比德(Malhar Bhide)均来自伊利诺伊大学厄巴纳-香槟分校(UIUC)野心理科学专科,曾从事野心理视觉与强化学习计划,其中,亚什曾获取 2022 年 OpenCV AI Research Competition 一等奖,马尔哈高中时期就在《科学讲演》(Scientific Reports)发表过疾病建模论文。
2025 年 10 月 8 日,Origin Bio 持重发布自研模子 Axis,这是业内首个同期具备生成与揣测功能的调控 DNA AI 模子。它协调了 DNA-to-DNA、DNA-to-function 与 function-to-DNA 三类任务:既能从更生成序列或基于辅导优化,也能揣测序列的功能属性。
Axis 基于分享 Transformer 主干聚集结束多任务锤真金不怕火,接纳 ENCODE V4 注册表中的孤苦顺式调控元件数据进行无稠浊分割锤真金不怕火。在揣测调控元件活性基准测试中,Axis 平均卓绝 Google DeepMind 的 AlphaGenome 模子 6.7%。在“高合资亲和力”的辅导下,Axis 生成的序列中标的转录因子合资位点可富集高达 9 倍。

Origin Bio 正接力于“用 AI 打造更安全的细胞与基因疗法”,银河国际游戏平台官网核心是联想新式调控 DNA 元件,如增强子与运转子,结束诊治基因抒发的精确编程,主要面向癌症、核心神经系统疾病等需要条目性激活的合乎症。畴昔,其但愿构建大家最大畛域的合成调控序列独荒芜据集,通过高通量实践考据累积数百万条跨多种细胞现象的功能凝视序列。
10,000 个 AI 联想的生物学“微调旋钮”
本次发布的 10,000 条序列恰是由 Axis 针对特定细胞现象辅导生成的 pELS 序列,这是一类位于基因转录肇始位点(TSS)隔邻约 2 kb 范围内、能够显贵增强基因转录活性的短 DNA 序列。这批 AI 联想的序列故意针对三种在医学计划中极具代表性的细胞系:SK-N-SH(神经母细胞瘤细胞系)、HepG2(肝细胞癌细胞系)和 K562(红白血病细胞系)。
为了让这批序列在果然科研环境中的可用性更高,每条序列均附带完整质地限度数据和多维度的揣测数据。其底层序列质地运筹帷幄包括最差发卡结构踏实性(worst hairpin stability, ΔG)、GC 含量、核苷酸构成比例以及最长同聚物(homopolymer)长度。并为转录因子合资位点(TFBS)提供凝视,援助用户进行高档过滤与可视化,匡助计划者流露序列招募特定卵白质、运转基因抒发的具体机制。
在跨细胞系活性揣测中,Origin 调用了由哈佛-麻省理工博德计划所(Broad Institute)孤苦开发、经过体外考据的深度卷积神经聚集模子 Malinois。该模子能够仅凭 DNA 序列,高精度地揣测顺式调控元件(CRE)的活性。
为了直不雅展示 DNA 双链分子的空间构象,Origin 还使用了字节率先开源的 AlphaFold 3 复现模子 Protenix。Protenix 能够精确揣测包括卵白质、DNA、RNA 在内的复杂生物分子 3D 结构。

扫数序列至极元数据已一起上传至 Switch 平台。平台不仅提供浏览、下载与可视化功能,还将抓续托管公司与社区的湿实践考据驱散,援助计划者上传自己评估数据,变成协调累积。Origin Bio 明确暗示,Z6尊龙凯时将陆续向库中添加针对原代细胞与组织的更多联想序列。
范式转机:从“二元开关”到“贯穿调控”
为什么 Origin 要吃亏高大算力去大畛域联想并测试这些调控元件库?谜底在于对细胞运谈的极致掌控。
在传统的扰动生物学中,科学家们主要依赖两种技能来计划基因功能:其一是 CRISPR 等基因敲除(Knockouts)或敲降(Knockdowns)本领。这在很猛进度上是一种“二元操作”,基因要么被填塞纷扰、不抒发,要么存在。其二是化学药物处理,天然不错通过药物浓度结束“剂量限度”,但化学小分子常常贫乏靶向特异性,容易同期激发多条信号通路的脱靶效应。
果然的人命系统远比“0 和 1”复杂。细胞的运谈决定骨子上是由基因抒发的“剂量”驱动的,卵白质的合成数目、时空抒发齐会影响最终表型。公司强调,调控 DNA 元件能编码时空特异性逻辑,使药物更具可编程性,从而普及特异性并反映细胞现象变化。这对细胞与基因疗法安全性至关重要。
Origin 通过 AI 联想出具有梯度转录强度的调控元件库,这将为扰动生物学代带来更密致、更高成果的基因调控计谋。科学家不错对特定基因的抒发水平进行贯穿性的精确限度,并基于此系统画图剂量-反映图谱。
举例,科学计划标明,肿瘤微环境中存在一条极其要害的“代谢-表不雅遗传轴”:坏死肿瘤会触发 T 细胞的“功能性热量截至”,进而耗竭核质内的乙酰辅酶 A(acetyl-CoA)。这会剥离效应基因和耗竭基因位点上激活性的组卵白修饰记号,从而“得不偿失”地保留了 T 细胞的干性,这恰是产生抓久抗肿瘤反应的要害现象。白细胞介素-10(IL-10)似乎不错通过近似阶梯重编程临了耗竭的 CD8+ T 细胞,还原其抗肿瘤功能。
现在,计划东谈主员还不了解是否存在一个齐全的抒发阈值,能让 IL-10 刚好将耗竭的肿瘤浸润淋巴细胞(TILs)翻转到成心现象,而又不会“用劲过猛”激发免疫禁绝。有了 Origin 提供的梯度调控元件库,计划东谈主员终于不错系统性地画图这一阈值图谱,透澈告别往常仅靠单一“过抒发构建体”盲目臆想的期间。
再比如,T 细胞疗法的临床数据中有两个决定疗效的最强揣测运筹帷幄:T 细胞干性以及多克隆肿瘤反应性。但在现存的细胞疗法制造历程中,当 T 细胞在体外大畛域扩增时,这两种极其谨慎的特质会速即流失。能够识别肿瘤的克隆型被选拔性淘汰,而剩余的细胞则走向“临了分化”,失去了抓续斗争的后劲。
如若科学家能在体外扩增期间,驾御 AI 联想的梯度调控序列,精确滴定干性关系转录因子(如 TCF7 或 BACH2)的抒发,就有望找到一个极其精确的“黄金剂量”:在这个剂量下,T 细胞既能齐全保管自我更新才智,又不会阵一火其对肿瘤的杀伤效应潜能。
开源共建“可编程药物”的畴昔
Origin Bio 也承认自家公司在这项计划中的局限性:“需要开展的实践、有待发现的机制以及将要产生的影响,远远超出了任何一家单一机构的才智范围。”
因此,跟着 10,000 条 AI 联想的序列向全网通达,Origin 明确暗示,他们但愿大家的科研职责者能将这些序列应用于 MPRA 计划,以及 ATAC-seq、ChIP-seq 等遗传组学功能性检测实践中。跟实在践数据的回流,Origin 甘愿将在平台上公开考据驱散,并允许其他科研团队同步分享他们的数据。畴昔,他们还磋磨将生成的序列库膨大到原代细胞和更多组织类型中。

莽撞媒体与社区商榷速即张开,各路大师对此评价不一。Y Combinator CEO Garry Tan 称“AI×bio 是简直未被波及的畛域”。斯坦福大学野心基因组学家安舒尔·昆达杰(Anshul Kundaje)则在 X 转帖辩驳,这次发布“更像是炒作而非严肃奋勉”:三种细胞系永别过于简便、零落与开源用具的 benchmark 对比,且贫乏湿实践考据。
抢庄牛牛APP官网下载
不管何如,Origin Bio 大概正在推进 AI 生成调控 DNA 从实践室走向社区协调的新阶段。人命科学正从“盲东谈主摸象”式的试错发现,迈向编写野心理代码般精确的“可编程生物学”期间。
https://x.com/garrytan/status/2032565231847629215
https://x.com/anshulkundaje/status/2033006691873337710
运营/排版:何晨龙尊龙凯时