手把手用Python模拟RNA折叠：用代码理解生命起源假说

张开发

• 2026/6/22 19:59:50 • 15 分钟阅读

分享文章

手把手用Python模拟RNA折叠用代码理解生命起源假说在探索生命起源的众多假说中RNA世界理论因其简洁性和实验支持而备受关注。这个假说认为在生命演化的早期阶段RNA分子可能同时承担了遗传信息存储和生化反应催化的双重角色。对于程序员和生物信息学爱好者来说没有什么比用代码重现这一过程更能深入理解其原理了。本文将带你用Python构建一个简化版的RNA折叠模拟器通过计算生物学的方法验证RNA自我复制和催化的可能性。1. RNA折叠的基础原理RNA分子是由核苷酸组成的单链结构与DNA不同它能够通过碱基配对形成复杂的二级结构。这种自我折叠的能力是RNA具备催化功能的关键。让我们先了解几个核心概念碱基配对规则A与U配对C与G配对与DNA的A-T、C-G略有不同二级结构元素茎环结构stem-loop最常见的RNA折叠形态发夹结构hairpin特殊的茎环结构凸起bulge配对区域中的不匹配碱基内环internal loop两个配对区域之间的非配对区# RNA碱基配对检查函数 def is_complementary(base1, base2): pairs {A: U, U: A, C: G, G: C} return pairs.get(base1) base2RNA的折叠自由能可以用以下近似公式计算ΔG ΔG_initiation ΣΔG_stack ΣΔG_loop其中ΔG_stack表示堆叠碱基对的能量贡献ΔG_loop表示各种环结构的能量惩罚。2. 构建RNA折叠模拟器我们将使用Python的BioPython库来实现一个简化版的RNA折叠预测器。首先需要安装必要的依赖pip install biopython matplotlib numpy2.1 最小自由能算法实现RNA折叠预测的核心是最小自由能算法。我们采用动态规划方法来实现from Bio.Seq import Seq from Bio.SeqUtils import gc_fraction import numpy as np def predict_rna_folding(sequence): n len(sequence) # 初始化动态规划矩阵 dp np.zeros((n, n)) traceback np.zeros((n, n), dtypeint) # 填充动态规划矩阵 for length in range(1, n): for i in range(n - length): j i length # 情况1i和j配对 if is_complementary(sequence[i], sequence[j]): dp[i][j] dp[i1][j-1] get_pair_energy(sequence[i], sequence[j]) traceback[i][j] 1 # 情况2i不配对 if dp[i1][j] dp[i][j]: dp[i][j] dp[i1][j] traceback[i][j] 2 # 情况3j不配对 if dp[i][j-1] dp[i][j]: dp[i][j] dp[i][j-1] traceback[i][j] 3 # 情况4分叉结构 for k in range(i1, j-1): if dp[i][k] dp[k1][j] dp[i][j]: dp[i][j] dp[i][k] dp[k1][j] traceback[i][j] 4 k # 存储分叉点位置 return dp, traceback def get_pair_energy(base1, base2): # 简化的能量参数 pair_energies { (A, U): -2.0, (U, A): -2.0, (C, G): -3.0, (G, C): -3.0, (G, U): -1.0, (U, G): -1.0 } return pair_energies.get((base1, base2), 0)2.2 可视化RNA二级结构预测出RNA的二级结构后我们可以用matplotlib进行可视化import matplotlib.pyplot as plt from matplotlib.patches import Arc, Circle def plot_rna_structure(sequence, pairs): fig, ax plt.subplots(figsize(10, 6)) n len(sequence) # 绘制碱基序列 for i in range(n): ax.text(i, 0, sequence[i], hacenter, vacenter, fontsize12) ax.add_patch(Circle((i, 0), 0.3, fillFalse)) # 绘制配对连接线 for i, j in pairs: if i j: # 避免重复绘制 height (j - i) * 0.3 ax.add_patch(Arc(((i j)/2, -height/2), j-i, height, theta10, theta2180, fillFalse)) ax.set_xlim(-1, n) ax.set_ylim(-n/2, 1) ax.axis(off) plt.title(RNA Secondary Structure Prediction) plt.show()3. 模拟RNA自我复制过程RNA世界假说的关键环节是RNA分子的自我复制能力。我们可以模拟这一过程3.1 RNA模板复制模拟def rna_replication(template, error_rate0.01): complement {A: U, U: A, C: G, G: C} product [] for base in template: if np.random.random() error_rate: # 引入随机突变 product.append(np.random.choice([A, U, C, G])) else: product.append(complement[base]) return .join(product)3.2 复制-选择循环模拟def replication_selection_cycle(initial_sequence, generations10): population [initial_sequence] for gen in range(generations): new_population [] for seq in population: # 复制产生后代 offspring rna_replication(seq) # 选择保留折叠自由能较低的序列 if calculate_folding_energy(offspring) calculate_folding_energy(seq): new_population.append(offspring) else: new_population.append(seq) population new_population return population def calculate_folding_energy(sequence): # 简化的折叠自由能计算 dp, _ predict_rna_folding(sequence) return dp[0][-1]4. 从模拟到生物学启示通过上述代码模拟我们可以得出几个支持RNA世界假说的观察结果RNA自我折叠的普遍性几乎所有随机RNA序列都能形成某种二级结构催化位点的自然形成某些折叠结构会形成口袋状区域可能具备催化功能复制保真度与进化适度的错误率有利于新功能的产生下表比较了模拟结果与真实RNA酶的特性特性模拟结果真实RNA酶(如锤头状核酶)最小长度~15nt~30nt催化效率(kcat/Km)10⁻³ - 10⁻⁵ (模拟单位)10⁶ - 10⁸ M⁻¹s⁻¹错误率可调节(默认1%)~0.1% - 1%结构复杂度茎环结构为主包含多种三级相互作用在实际项目中我发现调整错误率参数对模拟结果影响显著过高的错误率导致序列快速退化而过低的错误率则限制进化潜力。最佳错误率大约在0.5%-2%之间这与实际RNA病毒的突变率惊人地一致。

更多文章

前端开发 2026/6/22 20:05:10

MySQL执行流程详解

1.执行流程 #mermaid-svg-a3ae5cQoH0nS2uhc{font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}@keyframes edge-animation-frame{from{stroke-dashoffset:0;}}@keyframes dash{to{stroke-dashoffset:0;}}#mermaid-svg-a3ae5cQoH0nS2u…

如何使用Qwen Code文件系统工具：智能代码探索与分析的完整指南【免费下载链接】qwen-code An open-source AI agent that lives in your terminal. 项目地址: https://gitcode.com/GitHub_Trending/qw/qwen-code Qwen Code是一款开源AI代理工具，…

张开发

前端开发 2026/6/14 17:05:53

用STM32F103的PWM实现呼吸灯：深入理解__HAL_TIM_SET_COMPARE宏与占空比动态调节

STM32F103 PWM呼吸灯实战：从寄存器操作到动态调光算法优化呼吸灯作为嵌入式开发的经典案例，看似简单却蕴含了PWM控制、定时器配置、动态算法等多个核心技术点。本文将基于STM32F103C8T6的TIM4定时器，通过PB8引脚驱动LED，深入探讨…

张开发

手把手用Python模拟RNA折叠：用代码理解生命起源假说

最新文章

FPGA异步FIFO读写位宽转换实战：从8bit到32bit的数据拼接与拆分（Vivado+Modelsim）

从图像模糊到语音识别：卷积在AI中的实战应用与Python代码示例

车载OTA升级中Docker层缓存失效导致回滚失败？3步构建可复现、可签名、可审计的分层镜像流水线（含Sigstore+Notary v2集成）

盛合晶微科创板上市，开盘市值近1858亿，无锡国资投资回报率超600%

如何用AI大模型技术一键批量生成和发布短视频？MoneyPrinterPlus全攻略

一张“网”如何拯救生命？浅谈医疗系统集成平台iPaaS

推荐文章

相关文章

分享文章

更多文章

MySQL执行流程详解

中国蚁剑的下载、安装与实战应用指南

避开Cache和MMU：Trace32里A、NC、ANC三种访问类型到底该怎么选？

深入解析PX4开源飞控：从架构设计到固定翼实战开发的完整指南

BetterNCM Installer技术深度解析：Rust驱动的网易云音乐插件管理器实战指南

重塑笔记体验：OneMore插件解锁OneNote的隐藏潜能

The Loss Surfaces of Multilayer Networks 论文阅读

漏电流的检测要求和理解

Z-Image-Turbo-辉夜巫女快速上手：5分钟完成镜像拉取、容器运行、WebUI访问

基于WindyAPI的气象数据可视化开发实战

如何使用Qwen Code文件系统工具：智能代码探索与分析的完整指南

用STM32F103的PWM实现呼吸灯：深入理解__HAL_TIM_SET_COMPARE宏与占空比动态调节