1篇1章1节:什么是人工智能和生成式人工智能

张开发
2026/4/8 9:18:00 15 分钟阅读

分享文章

1篇1章1节:什么是人工智能和生成式人工智能
在现代科技高速迭代的背景下人工智能技术已深度融入生物医药研发全流程从药物发现、临床试验设计到临床诊疗、精准医疗等关键领域均释放出颠覆性的应用价值。近年来生成式人工智能更是成为生物医药领域的前沿热点引发全球科研界的广泛关注。生成式人工智能依托海量生物数据、临床数据与文献数据进行模型训练可自主生成全新内容在医药领域具体体现为全新药物分子结构设计、疾病诊断报告生成、医学影像重构、科研文献摘要撰写等。该技术打破了传统医药研发周期长、成本高、试错率高的局限有效激发科研创新活力助力新药研发、靶点筛选、制剂优化等环节实现突破大幅提升生物医药领域的科研效率与生产力。对于医药研究人员而言系统掌握人工智能及生成式 AI 技术能够借助智能算法高效挖掘生物大数据、优化实验方案、解析复杂病理机制以全新的科研工具与研究思路攻克传统方法难以突破的医学难题这也是当下医药科研人才的核心素养 —— 具备多维度科研思维快速适配技术变革推动医药研究创新升级。而掌握相关技术的前提是建立基础认知。本文将围绕人工智能与生成式人工智能的核心概念展开阐述为医药领域从业者搭建认知基础。一、人工智能Artificial Intelligence人工智能Artificial Intelligence, AI的概念可以追溯到20世纪50年代当时数学家和计算机科学家开始探讨如何让机器模拟人类智能。1956年达特茅斯会议被认为是人工智能研究的正式起点。然而生成式人工智能Generative Artificial Intelligence, GAI的发展历程当从20世纪60年代的诞生开始到了今天生成模型不仅限于文本生成还扩展到图像生成、音乐生成和视频生成等领域。从1940年代开始科学家们在数学推理的基础上发明了可编程数字计算机这一突破激发了他们对创建“电子大脑”的探索热情为后续的人工智能发展奠定了坚实的基础。1956年由约翰·麦卡锡等人组织的达特茅斯会议正式标志着人工智能作为独立研究领域的诞生参会者预测机器将在一代人内达到人类智能的水平。然而1974年至1980年间由于Lighthill报告的批判人工智能研究经历了第一次“AI寒冬”资金和热度骤减但逻辑编程和常识推理等新观念仍在不断涌现为未来指明了新的方向。到了1980年代随着专家系统的发展人工智能迎来了复兴期取得了里程碑式的成就。1997年IBM的深蓝击败了国际象棋冠军加里·卡斯帕罗夫成为这一时期的标志性事件。同样在1986年恩斯特·迪克曼斯发明了第一辆自动驾驶汽车进一步展示了人工智能的潜力。进入2010年代机器学习和深度学习的崛起使得人工智能技术迅猛发展成为各类应用的核心。如今AI系统不仅能生成富有创意的回应处理大规模数据还能完成过去被认为无法实现的任务推动了智能客服等领域的革命性进步。在人工智能中“人工”一词源自英文单词“artificial”。在日常用语中“artificial”意为合成的往往带有负面意味意味着“人造物体仅仅是真实物体的次要形式”。但实际上人造物体常常优于真实或者自然物体。“智能”intelligence指的是个体从经验当中学习、进行正确推理、记住重要信息以及应对日常生活需求的认知能力。史蒂芬•卢奇在《Artificial Intelligence》中认为人工智能是由人people、想法idea、方法method、机器machine和结果outcome等要素构成的。首先构成人工智能的核心是人。人拥有想法并将这些想法转化为方法。通过算法、启发式方法、程序或计算核心的系统这些想法得以表达。最终我们获取了这些机器程序所产生的产物称之为“结果”。每一个结果都能够依据其价值、效果和效率进行衡量。二、生成式人工智能Generative AI生成式人工智能Generative AI是人工智能的一个子集是一种能够根据用户提示创建新内容的人工智能技术包括文本、图像、音频和视频等。这一能力通过复杂的机器学习模型尤其是称为生成模型的深度学习模型来实现。这些模型从大量的训练数据中学习模式和结构能够生成与输入数据具有相似特征的原创内容。其实 生成式人工智能的开始我们可以从1960年代ELIZA的出现讲起。1、1960年代的ELIZA的出现Joseph Weizenbaum(Professor emeritus of computer science atMIT). Location: Balcony of his apartment in Berlin, Germany.生成式人工智能的旅程始于约瑟夫·韦森鲍姆Joseph Weizenbaum在1966年开发的ELIZA开发。ELIZA的重要性不仅在于其技术成就它是第一个以智能对话形式出现的程序之一是现代聊天机器人chatbot的先驱也是早期尝试解决图灵测试的著名案例。ELIZA这个名字取自乔治·萧伯纳的戏剧《皮格马利翁》中的纯真少女。ELIZA可以与用户进行聊天使用韦森鲍姆自己创建的SLIP编程语言编写。该程序应用模式匹配规则来生成回复这类程序现在被称为聊天机器人。ELIZA由一个名为DOCTOR的脚本驱动能够与人类进行对话其对话风格令人惊讶地类似于富有同理心的心理学家。韦森鲍姆还模仿了心理治疗师卡尔·罗杰斯Carl Rogers的对话风格后者引入了开放性问题以鼓励患者更有效地与治疗师交流。其实刚开始的时候韦森鲍姆开发ELIZA的初衷是探索人机交流的动态。但是他发现尽管ELIZA并不真正理解用户与机器之间的对话但它通过模式匹配和替换技术创造了理解的假象。然而用户对ELIZA的情感反应感到惊讶许多人将人类般的特质归因于该程序。这种现象后来被称为“ELIZA效应”。“ELIZA 效应”指的是人们在与看似智能的计算机程序交流时倾向于赋予其超出实际能力的理解和智能感知。例如当用户向 ELIZA 倾诉自己的烦恼时即使回复只是一些模式化的语句用户也可能会觉得得到了有意义的回应和理解。这种效应揭示了人们在与技术交互时容易产生对技术智能程度的过高估计。这促使韦森鲍姆深刻反思人工智能的影响及其误导人们对机器能力的潜在风险。韦森鲍姆的后续著作特别是他的书《计算机的力量与人类的理性》Computer Power and Human Reason阐述了他对人工智能伦理问题的担忧强调了人类判断与机器计算之间的区别。2、1980年代–2000年代深度学习的年代1980年代至2000年代是深度学习的早期阶段主要特点如下这一时期主要关注神经网络的基本理论和算法发展包括前馈神经网络和卷积神经网络等。在应用领域深度学习算法开始在图像识别和自然语言处理等领域进行初步探索。然而由于计算能力的限制深度学习在这一时期的发展相对缓慢。1980年代个人计算机和大规模计算的普及为深度学习的发展奠定了基础。然而从2010年代至今随着计算能力和数据存储的快速增长深度学习开始大规模应用于各个领域。云计算和GPU等技术的快速发展为深度学习提供了强大的计算支持促进了技术突破。深度学习的应用范围不断扩大广泛应用于自动驾驶、医疗诊断、金融风险评估等领域。同时深度学习算法也逐渐发展成多种类型如递归神经网络和生成对抗网络等。深度学习Deep Learning是机器学习的一个分支是一种基于人工神经网络的数据表征学习算法。它的主要特点包括多层结构使用多层神经网络来处理数据通过逐层提取特征来学习复杂的表示自动特征提取能够从原始数据中自动学习特征无需人工设计强大的学习能力能够处理大规模数据并在图像识别、语音识别、自然语言处理等领域取得突破性成果多种网络架构包括卷积神经网络CNN、循环神经网络RNN、深度置信网络DBN等适用于不同类型的任务高度非线性通过多层非线性变换能够学习和表示复杂的数据模式端到端学习可以直接从原始输入到最终输出进行学习无需中间步骤。3、2014年-2017年生成对抗网络的突破伊恩·古德费洛Ian Goodfellow出生于1987年在斯坦福大学获得了计算机科学的学士和硕士学位导师是吴恩达。随后他在蒙特利尔大学获得机器学习博士学位导师是约书亚·本希奥和亚伦·库维尔。2014年它引入了生成对抗网络Generative adversarial networkGAN这是生成式人工智能领域的一个里程碑。GAN有两个核心组件生成器Generator和判别器Discriminator。生成器负责生成假数据试图欺骗判别器判别器则负责区分真实数据和生成的假数据。在对抗训练过程中生成器不断学习生成更逼真的数据而判别器则不断提高识别真假数据的能力。两个网络相互竞争不断改进最终目标是生成器能够产生与真实数据无法区分的假数据而判别器将无法准确区分真假数据只能随机猜测50%概率。简单来说这种创新的框架包括两个互相对抗的网络一个生成内容另一个评估内容推动了更为逼真和复杂输出的创造。GAN在多个领域有广泛应用包括图像生成创建逼真的图像、提高图像分辨率等、数据增强为机器学习模型生成训练数据、3D模型生成根据2D图像生成3D模型和艺术创作生成新的艺术作品。GAN的优势在于能够更好地建模数据分布生成清晰、锐利的图像并且理论上可以训练任何类型的生成器网络无需使用马尔可夫链反复采样。然而GAN的训练过程不稳定容易出现模式崩溃等问题并且需要大量计算资源。得益于GANs和深度学习技术的进步生成式人工智能的领域蓬勃发展。这一时期见证了生成模型的多样化包括用于文本和视频生成的卷积神经网络CNNs和循环神经网络RNNs以及用于图像合成的变分自编码器VAEs和扩散模型的出现。大规模语言模型LLMs的发展始于GPT-1展示了前所未有的文本生成能力标志着该领域的重大飞跃。4、2017年-至今快速扩展期现在的生成模型不仅限于文本生成还扩展到图像生成、音乐生成和视频生成等领域。以GPT系列为代表的大规模语言模型在自然语言处理方面取得了显著进展能够生成高质量的文本内容。这些模型的成功展示了生成式人工智能在多个领域的广泛应用潜力。ChatGPT 4.0 展示了令人印象深刻的自然语言理解和生成能力能够处理复杂的对话、回答问题、撰写文章以及生成创意内容。其核心优势在于能够生成连贯且上下文相关的文本这使得它在各种应用场景中得到了广泛使用从客户服务到内容创作再到编程助手。MidJourney是一个基于生成式人工智能的图像生成平台专注于从文本描述生成高质量的图像。用户只需输入简短的文本描述MidJourney就能生成相应的图像展示出生成式人工智能在视觉内容创作中的强大潜力。MidJourney的出现使得非专业用户也能够轻松创作出复杂的图像为艺术创作、设计和媒体制作提供了新的可能性。在今天的高科技时代回顾ELIZA的故事和GAI的发展历程我们不仅能看到技术进步的轨迹也能反思人工智能与人类社会之间不断演变的关系。虽然ChatGPT等现代模型在功能和复杂性上超越了ELIZA但正是这种最早的尝试开启了我们对智能机器无尽可能性的探索之路。三、现在的生成式人工智能​现在你可能已经在电子邮件或文本编辑器中的自动完成功能中遇到过生成式人工智能了它可以帮助你自动完成以惊人的准确度预测你的句子结尾。这种变革性技术不仅仅是数据分析它是在完全新的创造中注入生命打破我们对机器所能实现的边界。静态、预编程响应的日子已经过去。生成式人工智能模型通过学习和适应模仿人类观察、理解和创造的能力。这些模型通过分析大量的图像、文本、音频等数据集破译定义每个领域的潜在模式和关系。凭借这些知识它们不仅能模仿还能超越模仿生成完全新颖的内容这些内容感觉新鲜、原创并且常常与现实世界的内容非常相似。生成式人工智能的应用范围广泛涵盖了各个行业和领域。以下是一些典型应用1. 文本生成生成式人工智能在文本生成领域表现尤为出色。通过大规模数据预训练生成模型可以生成高质量的文本内容。例如文心大模型4.0在输入和输出阶段都进行知识点增强。一方面对用户输入的问题进行理解并拆解出回答问题所需的知识点然后在搜索引擎、知识图谱、数据库中查找准确知识最后把这些找到的知识组装进prompt送入大模型准确率好效率也高。另一方面对大模型的输出进行反思从生成结果中拆解出知识点然后再利用搜索引擎、知识图谱、数据库以及大模型本身进行确认进而对有差错的点进行修正。​2. 图片生成生成式人工智能在艺术和设计领域展现了巨大的创造力。通过学习大量的艺术作品和设计样式生成模型可以创作出独特且富有创意的艺术作品。Midjourney 是由位于美国加州旧金山的同名研究实验室开发的人工智能程序由 Leap Motion 的创办人大卫·霍尔兹David Holz领导。它可以根据文本生成图像于 2022 年 7 月 12 日进入公开测试阶段用户通过 Discord 的机器人指令操作。其核心功能是把文本提示转换为图像能生成涵盖建筑物、场景、艺术插画、写实照片和人物画等多种风格和主题的高质量图像。算法不断改进相继发布了多个版本第二版于 2022 年 4 月推出第三版于 2022 年 7 月 25 日发布第四版的 alpha 迭代版于 2022 年 11 月 5 日发布第五版的 alpha 迭代版于 2023 年 3 月 15 日发布。另外Stable Diffusion是一个由Stability AI开发的文本到图像的深度学习模型属于潜在扩散模型Latent Diffusion Model, LDM的一种变体。它能够根据用户提供的文本描述生成高质量的图像广泛应用于艺术创作、设计和其他视觉内容生成领域。3. 音乐创作在音乐创作领域生成式人工智能同样展现了惊人的潜力。通过学习大量的音乐数据生成模型可以创作出风格多样的音乐作品。例如Suno AI是一个生成式人工智能音乐创作平台旨在让用户根据文本提示生成逼真的歌曲。自2023年12月20日上线以来Suno已吸引了大量关注以其创新的方法将音乐创作民主化使从普通用户到专业艺术家都能轻松上手无需任何乐器或深厚的音乐理论知识。4. 视频生成生成式AI视频生成是指利用人工智能算法创建视频内容的过程。这些系统可以从文本描述、图像或短视频剪辑等各种输入中生成视频。如Leonardo等工具可以将静态图像转换为短视频剪辑用户可以调整运动强度等参数来自定义输出效果。Runway MLGen-2等平台提供编辑现有视频或基于视频输入生成新内容的功能可以延长剪辑、改变风格或向视频添加新元素等等。​Sora是一个能以文本描述生成视频的人工智能模型由美国人工智能研究机构OpenAI开发。Sora这一名称源于日文“空”そら sora即天空之意以示其无限的创造潜力。其技术基础是在OpenAI的文本到图像生成模型DALL-E上开发的。模型的训练数据既包含公开可用的视频也包括专为训练目的而获授权的视频但OpenAI没有公开训练数据的具体数量与确切来源。OpenAI于2024年2月15日向公众展示了由Sora生成的多个高清视频称该模型能够生成长达一分钟的视频。同时OpenAI也承认了该技术的一些缺点包括在模拟复杂物理现象方面的困难。《麻省理工科技评论》报道称演示视频令人印象深刻但指出它们可能是经精心挑选的并不一定能代表Sora生成视频的普遍水准。DeepSeek 是一家 2023 年成立于杭州由梁文峰创立在北京和深圳设有研发中心的人工智能公司。核心团队成员来自顶尖科技公司和学术机构。其专注于 AGI 领域研发推出了多模态大模型 DeepSeek-R1、代码生成模型 DeepSeek-Coder、开源模型 DeepSeek-MoE 及 DeepSeek-V3 等在国际评测榜单表现优异具有效率高、成本低、开源等特点。其中DeepSeek-R1 模型的开源许可证是 MIT 许可证。DeepSeek-R1 是幻方量化旗下 DeepSeek 研发的推理模型于 2025 年 1 月 20 日正式发布并开源模型权重12。该模型在后训练阶段大规模使用强化学习技术在数学、代码、自然语言推理等任务上性能比肩 OpenAI o1 正式版推理过程有大量反思和验证思维链长度可达数万字引起了业界很大的反响。

更多文章