我国生物信息学领域文献计量学研究

【摘要】本文应用文献计量学的方法,通过对我国生物信息学研究论文的时间分布、地区分布、期刊分布、高产单位和作者、论文/作者频率分布和合著情况等进行分析,以揭示我国生物信息学研究现状,为科研管理和人才培养提供一定的指导。

【关键词】生物信息学 文献计量学 研究现状

【中图分类号】TB9【文献标识码】A【文章编号】1673-8209(2010)04-0-02

1 概述

1.1 文献计量学研究概况

文献是科学知识的载体,是科研成果的主要表现形式。文献的产生、分布、增长、老化和引证都与科学的交叉渗透和发展进化息息相关。文献信息源的定量研究开始于20世纪初,逐渐形成了以布拉德福(Bradford)定律、齐普夫(Zipf)定律、洛特卡(Lotka)定律、文献增长规律、文献老化规律、文献引用规律六大规律为主体的、比较完整、系统的文献计量学体系,并在后来的研究中得到不断的发展和完善。用文献计量学方法研究科学活动特征与科学发展规律,是文献计量学应用研究的重要内容。

1.2 生物信息学研究概况

生物信息学是采用计算机技术和信息论方法,研究生命科学中各种生物信息表达、采集、存储、传递、检索、分析和解读的科学,是现代生命科学与信息科学、计算机科学等学科相互渗透形成的新学科。

生物信息学是20世纪80年代末随着人类基因组计划的启动而兴起的一门新的交叉学科, 最初常被称为基因组信息学。生物信息学产生和发展的推动因素主要有以下三方面: 一是人类基因组计划; 二是信息技术的大规模应用; 三是生物医药的迅速发展及其经济的需求。伴随着基因组研究, 相关信息出现了爆炸性增长, 迫切需要对海量生物信息进行处理[3]。

2 生物信息学文献分布现状

笔者以CNKI中国期刊全文数据库为检索工具,本文以生物信息学为检索入口,以主题检索方式进行检索,并从中删除通知、会议、短讯、动态、简要、消息、新闻报道及部分不相关文献。处理后,共检出了1994年至2009年的5296篇生物信息学文献。

2.1 文献总量及年度变化

经统计,从1994年到2009年5月的生物信息学文献总量为5296篇,我国在1995年就有生物信息学文献刊载,这被认为是我国对生物信息粗浅的认识阶段;但早期的研究文献以综述或评论性为主,并没有进入深度的实验研究。1998年生物信息学文献量增长速度较快,但文献总量还偏低;2000年文献量剧增,累计文献量303篇。经过其后3年的发展,2004年和2005年两年的文献量基本持平,占总量的11.6%;2006年至今,文献量基本保持缓慢增长。从总体来看,文献量呈现逐年增长到基本保持平稳的态势,随着文献量基数越来越大,增长速度渐趋缓慢,表明学科正逐渐走向成熟。

2.2 论文的地区分布

1994年—2009年间,全国有30个省、市、自治区发表了生物信息学论文,但地区差异悬殊。我国生物信息学研究论文的地区分布极不平衡,北京以1113篇的发文量遥遥领先于其它地区,占总论文量的21%;其次是上海511篇,湖南295篇,广东251篇。上述居于前四位的地区发文量占总量的41%,可以视为我国生物信息学研究的核心地区。其它发文量居于前12位内的地区包括:江苏、重庆、浙江、陕西、山东、天津、辽宁和四川,这8个地区总的发文量是1482篇,占总量的28%,是我国生物信息学研究的有机力量。但是,贵州、青海、江西、宁夏、海南、河北和广西七省的累计发文量才158篇,只占总量的约3%,说明这些地区的生物信息学研究较为薄弱,亟待加强。值得注意的是,有美国(6篇)、英国(1篇)、荷兰(1篇)、德国(1篇)和新加坡(1篇)的作者在我国的相关期刊上发表生物信息学论文,体现了科研领域国际间的交流与合作,同时也可以看出我国的相关期刊努力吸引海外优秀论文,寻求在国际范围内的学术影响作用。

2.3 论文的期刊分布

5296篇文献分布在839种期刊上,按其载文量的多少排名,前22位期刊的载文量共1853篇,占总载文量的35%。其中,发文量最多的8种期刊是:世界华人消化杂志、生物化学与生物物理进展、生物信息学、医学信息、生物技术通讯、生物技术通报、遗传学报和中国生物工程杂志等。这些期刊的载文量大,论文质量高,代表中国生物信息学研究的前沿水平,可以被视为中国生物信息学领域的核心期刊。但是,上述的8种期刊总载文量为636篇,只占总论文数的12%;更多的文献则分散在其它期刊中。其中,仅刊载一篇相关论文的期刊多达485种,占总期刊数的58%,但其刊载的论文只占总论文数的20%。这表明我国生物信息学研究文献的分散程度很高,文献分散在大量不同的期刊中。其中,很多论文刊载在基础医学、临床医学、药学、计算机等学科的期刊上。

2.4 多产单位分析

根据对我国生物信息学研究文献的第一作者单位进行统计分析,共有475家单位发表过生物信息学文献。发文量在20篇以上的22个单位,共发文2383篇,占总发文量的45.2%,成为我国生物信息学研究较为集中的核心单位。在22个高产单位中有高等学校17个;科研机构4个,医院1个。说明高等院校和科研院所是生物信息学研究的主力军。从高产单位排名看, 中南大学产出的论文数量最多,其次是中国科学院、中国人民解放军第302医院、军事医学科学院和中山大学,这五个单位显示了其在生物信息学研究领域雄厚的研究实力和丰硕的研究成果。

2.5 高产作者分析

在对论文合作者进行处理时,不考虑作者在论文署名中的先后顺序,即只要在论文作者款目中出现一次,其频次计为1,最后,以每位作者的总频次为依据统计每位作者的发文量。另外,统计作者发文量时,由于同一学科中核心作者同名的情况较少,且不会对整体结果造成大的影响,因此,没有考虑作者同名的情况。

发文量在10篇以上的作者有70位,分布在19个不同的单位,分别为,解放军第302医院(21位)、上海第二医科大学(8位)、复旦大学(6位)、北京大学(4位)、北京地坛医院传染病研究所(3位)、军事医学科学院放射医学研究所(3位)、南华大学(4位)、中南大学湘雅医学院(3位)、中山大学(4位)、中国科学院(2位)、西安交通大学(2位)、苏州大学(2位)。从这些数据中可看出我国生物信息学高产作者主要集中在北京和上海,同时也表现出北京和上海在生物信息学研究领域的技术和人才优势。

2.6 论文/作者频率分布情况

科学论文是科研成果的主要表现形式,而且有大量的科研人员致力于某一领域的科学研究,但不同的研究人员攒写的论文数量有多寡之分。洛特卡定律正是对科学论文著者的不平衡分布规律进行了探讨。根据洛特卡定律我们可以明确,在宏观的科研著述活动中,少数作者写出了大量的文章,而大多数人的著述则是不多的。

我国生物信息学论文的作者数为7289人,仅发表一篇论文的作者有5321人,占作者总人数的73%;发文量在10篇以上的高产作者有95人,占作者总人数的1.3%。结果与洛特卡定律所揭示的规律基本相符。

2.7 合著情况

大科学时代,科学技术的发展在不断分化的基础上开始走向新的综合,学科间交叉渗透日趋加剧,许多研究项目和课题规模与难度不断加大,越来越依赖于各学科集体来完成,这些变化要求科研人员必须采用工业化原则,形成分工协作的研究模式。而科研合作最明显的表现形式之一就是合作论文。作者合作程度的高低能反映作者合作科研开展程度和合作智能发挥程度,一篇论文有适量的合作者可以相互取长补短,切磋琢磨,充分发挥群体的智力,使论文在知识含量、结构与写作技巧等方面更趋完善。同时合作论文可以改善科学劳动组织,增加科研成果数量,提高科学劳动效率。

评价论文的合作程度有合作率和合作度两个指标,合作率指合作论文占总论文数的比例,论文的合作度指论文篇均作者数,它们体现了作者的合作规模,亦即作者的智力合作规模,数值越高,说明科研合作力度越大,智力合作越强。

1994~2006年我国生物信息学论文的平均合著率为75%,平均合作度为3.65;高于自然科学期刊的平均合著率71.66%和自然科学论文的平均合作度3.02。合作度和合著率是略有波动,但总体上是呈逐年上升趋势。

3 结论及思考

(1)生物信息学文献量呈现逐年增长到基本保持平稳的态势。文献量基数越来越大,增长速度渐趋缓慢,表明学科正逐渐走向成熟。另外,在通过逐一阅读文献标题对数据进行筛选的过程中,作者有一个大致的印象:在早期,我国生物信息学描述性文献占有很大比重。随着科学界对生物信息学认识的不断深化,大量实验性研究的生物信息学文献不断涌现。很显然,我国的生物信息学研究取得了巨大的发展,但是大多论文都是基于医学(如肿瘤、肝炎)研究中新技术的运用,而对生物信息学的基础研究(如基因或蛋白数据库)则非常少。我国生物信息学研究有待向更深和更广的领域进军。

(2)我国生物信息学研究的地区分布极不平衡。北京、上海、湖南和广东在生物信息学领域具有领先的科研和人才优势。而河北、海南、宁夏、江西、青海等省份,生物信息学研究十分的薄弱。建议这些地区要充分利用自身的优势,整合特色资源,同时也要加强和外界的沟通与合作。

(3)我国生物信息学期刊的国际影响力还不够。而且,国内的研究机构或研究人员与国外共同完成的论文也较少,建议国内的研究主体要积极寻求国际间的交流与合作,并且提高科研活动的自主创新能力。

(4)生物信息学是个多学科交叉的知识、技术密集型学科,小规模合作不利于高层次研究成果的产生。因此,科研管理者更要注重营造开放和信任的环境,同时科研人员必须改变传统的单枪匹马式的科学研究模式,积极主动地与有关机构或个人开展实质性的科研合作攻关,特别是跨地域、跨行业、跨部门的合作。

(5)经过十几年的发展和积淀,我国的生物信息学研究已经达到一定的水平。基因组学的发展已经进入后基因组研究阶段,致力于蛋白质功能研究的蛋白质组学和功能蛋白质组学正在蓬勃发展。针对我国生物信息学发展的现状,我国要制定出其宏观发展战略,注重本国生物信息学研究队伍的培养和专项科技攻关资金的投入,在国际一体化的科技大潮中不断提高我国生物信息学研究水平。

参考文献

[1] 李后卿,罗爱静.卫生信息管理概论[M].北京:科学出版社,2002:38-40.

[2] 刘莉,王倩飞.国内脑血管疾病核心作者测定及其队伍演变规律研究.中南大学研究生学位论文.2006.

[3] 郭晓华,王欣强.生命科学信息时代的标志——生物信息学[J].沈阳教育学院学报.2005,(7):131.

[4] 王玉梅,王艳,金奇.基于文献计量的我国生物信息学研究发展动态[J].科技情报开发与经济.2002,(12):1.

[5] 杨彩霞.从作者分析看我国情报学研究队伍的状况[J].现代情报.2005,(10):153-157.

[6] 程现昆.我国生物信息学研究现状与展望[J].中国科技信息.2006,(8):242.

[7] 朱杰.生物信息学的研究现状及其发展问题的探讨[J].生物信息学.2005,3(4):186.