2000-2025年上市公司企业创新质量数据

张开发
2026/4/18 0:58:35 15 分钟阅读

分享文章

2000-2025年上市公司企业创新质量数据
企业创新质量innov_qual是衡量企业技术创新深度与技术知识复杂性的核心指标。本数据集基于中国A股上市公司发明专利数据构建时间跨度为1988—2025年涵盖共计1048575条公司-专利观察值。核心指标包括股票代码、公司简称、申请年份、企业创新质量innov_qual。该指标参考Aghion et al.2019及张杰和郑文平2018的研究思路采用专利知识宽度法进行测度。专利知识宽度反映了专利所涉及技术知识的广泛性与复杂性知识宽度越大专利越难以被模仿或改进创新质量越高。具体而言首先基于专利的IPC分类号提取大组层级信息计算每件发明专利的知识宽度随后按企业—年份维度取知识宽度的中位数作为企业在该年度的创新质量。该指标能够有效刻画企业在特定年份内发明专利的技术多样性水平避免因专利数量分布不均带来的偏误。基于本数据集研究者可从开展三方面系统分析。一是政府补贴与企业创新质量的非线性关系研究。将创新质量指标与政府补贴强度、营商环境指数等变量匹配采用面板门槛模型检验补贴效应在不同营商环境水平下的差异化表现验证补贴政策是否存在“条件有效性”。二是创新质量对企业成长韧性的影响机制研究。利用创新质量指标与企业全要素生产率、销售收入波动性等韧性指标进行关联分析探究高质量创新是否能够增强企业在不确定性环境中的抗风险能力与恢复能力。三是创新质量的异质性分析。结合企业产权性质国有与非国有、行业属性战略性新兴产业与非战略性新兴产业以及地区制度环境政府廉洁度、产权保护度等进行分组检验揭示创新质量在不同情境下的驱动因素与作用边界为政策制定提供差异化依据。本数据集的指标构建严格遵循专利知识宽度的测度方法。首先从原始专利数据中提取公开号、IPC分类号、申请年份、公司名称、股票代码等字段并根据公开号后缀筛选发明专利以“A”结尾剔除实用新型专利以“U”结尾。其次针对每件发明专利的IPC分类号字符串格式如“H10F71/00; C25D7/12; H10F77/20”按分号拆分为多个IPC分类号并提取每个分类号的大组信息将分类号统一转换为“/00”结尾如“H10F71/00”形成该专利的大组列表。再次根据赫芬达尔—赫希曼指数的测算思路计算每件专利的知识宽度统计每个大组在该专利中出现的次数计算其占比平方和 ∑α2专利知识宽度定义为 1−∑α2。该值越大表示专利所涉及的技术大组越分散、知识覆盖越广泛。最后按股票代码与申请年份分组取各组内所有发明专利知识宽度的中位数作为该企业在该年度的创新质量innov_qual。对于某年无发明专利的企业该年度不纳入最终样本。所有处理均通过Python编程实现确保数据清洗、计算与汇总过程的可复现性。数据来源搜集整理所有数据真实有效时间跨度2000-2025数据格式Excel形式主要指标股票代码公司简称申请年份Innov_qual部分数据截图参考文献[1] Aghion P, Akcigit U, Bergeaud A, et al. Innovation and Top Income Inequality[J]. Review of Economic Studies, 2019, 86(1): 1-45.[2] 张杰 郑文平. 创新追赶战略抑制了中国专利质量么[J]. 经济研究 2018, 53(5): 28-41.[3] 叶初升 张清 马凯榕. 突破“创新悖论”政府补贴何以有效促进企业创新[J]. 中国工业经济 2025, (10): 40-58.【下载→方式一推荐主页 *个人* 简介经管数据集-CSDN博客方式二数据下载方式汇总-CSDN博客

更多文章