人工神经网络在海洋科学中的应用吴风霞1’2,李纯厚1,戴明1(1.农业部海水养殖生态与质量控制重点开放实验室,中国水产科学研究院南海水产研究所,广东广州;2.广东海洋大学水产学院,广东湛江)摘要:文章阐述了人工神经网络(artificial neural networks,ANN)在赤潮预测、海水质量评价、海洋预报、海洋初级生产力预测及渔业资源评估中的研究进展,讨论分析了神经网络应用中存在的问题及其局限性和发展趋势。关键词:人工神经网络;海洋科学;应用中图分类号:$951.2文献标识码:A文章编号:1673—2227一(2008)05—0075—06Application of artificial neural networks ocean sciencesWUFengxial一,LIChunhoul,DAIMin91(1.KeyLab.ofMariculture,Ecology andQualityControl,Ministry ofAgriculture,SouthChinaSeaFisheriesResearchInstitute,ChineseAcademy ofFisherySciences,Guangzhou,China;2.AquacultureCollege,GuangdongOceanUniversity,Zhanjiaug,China)Abstract:Artificial neural networks(ANN)was widely used in vaYious fields such as red tide forecasts,assessment of the quality of seawater,marine forecast,the prediction of marine primary productivity research as well as assessment of fishery resources.The trend and limitations ofANN applications is discussed in detail and analyzed in this paper.Key words:artificial neural networks;ocean sciences;application海洋科学的研究领域涉及到许多方面,包括赤潮、海水环境质量评价、海洋预报、渔业资源评估及海洋初级生产力等,已经成为全球普遍关注的热点之一。由于海洋环境中存在着复杂的物理、化学和生物作用,使海洋科学各领域的研究成为一个棘手的非线性问题。传统的分析方法,不但存在基函数选择及系数求解方面的困难,且求得的结果往往难以反映出因变量与自变量之问固有的、复杂的非线性关系。人工神经网络(artificial neural networks,ANN)是当前国际人工智能领域十分活跃的前沿研究领域,由于其具有好的容错性、并行处理信息、自学习性及非线性映射逼近能力等特点,因此,在生物学、医学、农学、环境科学、军事学、社会科学、气象及水文预报等领域获得了广泛的应用。3【。然而,ANN在海洋科学研究方面应用起步较晚,自20世纪90年代以来,国内外海洋科学界才掀起了研究应用ANN于赤潮预测预报、海水环境质量评价、海洋预报及渔业资源评估方面的热潮。因此,文章将着重讨论ANN技术在海洋科学中的应用现状及其发展趋势。收稿日期:2008-04-06;修回日期:2008-06-05资助项目:科技部科研院所社会公益研究专项资金项目(2005DIB3J020);中央级公益性科研院所基本科研业务费专项资金(中国水产科学研究院南海水产研究所)资助项目(2007ZD003)作者简介:吴风霞(1979一),女,博士研究生,从事渔业环境及其调控研究。E—mail:wufengxia333@126.con通讯作者:李纯厚,E-mail:scslch@vip.163.coin产一&水嘁方.呲南‰76南方水产第4卷 lANN概述ANN是由大量处理单元[神经元(neurons)]按特定方式连接而形成的网络,通过结构参数的调整对外部输入信息进行动态处理的系统¨o。ANN具有模拟人脑信息处理的功能,(1)通过学习过程利用神经网络从外部环境中获取知识;(2)内部神经元(突触权值)用来存储获取的知识信息。ANN的连接形式和拓扑结构多种多样,但总的来说有2种形式,即分层型和互联型神经网络(图1和图2)。有关神经网络的基本原理和算法,可参阅文献[5—6]。迄今为止,没计出的ANN模型类型很多,常见的基本模型有感知器、线性网络、BP网络、径向基函数网络、竞争型神经网络、自组织网络和学习向量量化网络、反馈网络。隐含层输出层 concealed layer output layer图1分层型神经网络的拓扑结构Fig.1The topology of layered neural network输入层隐含层输出层 input layer concealed layer output layer图2互联型神经网络的拓扑结构Fig.2The topology of interconnection neural network2ANN在海洋科学中的应用2.1ANN在海洋赤潮预测中的应用近年来,赤潮发生的频率及规模不断增加,给海洋渔业、海水养殖业及滨海旅游业等造成了一定的危害,经济损失严重。但是,赤潮是一种由多因素综合作用引发的生态异常现象,具有突发性及非线性等特点,并且赤潮生物种类繁多,不同海域发生赤潮的主要影响因子又不尽相同,因此,对其进行成功预测并进行有效的预灾减灾已成为社会迫切需要。国内外学者从不同角度开展了赤潮预测的研究,并提出了众多的赤潮预测方法,主要有经验预测法、统计预测法、动力学预测法等,但这些传统的预测方法真正有效的并不多。近几年随着计算机软件技术、人工智能以及生物技术的迅猛发展,人们开始探索将其应用于赤潮预测。20世纪90年代,RECKNAGEL7+将ANN运用于蓝一绿藻的种类丰度和演替预测研究,并基于1986~1993年8年的测量数据,将影响藻类生长的主要因子,如水的透明度、温度、营养盐及浮游动物的密度作为输入层,蓝一绿藻的主要种类,如微囊藻(Microcystis)、颤藻(Oscillatoria)、席藻(Phormidium)、束球藻(Gomphospheria)及鱼腥藻(Anabaena)作为输出层,同时利用5种不同的训练模型进行验证,结果表明,ANN浮游植物模型具有较好的预测潜力,并促进了ANN在水华、赤潮方面的研究。WILSON和RECKNAGEL博1与KUDELA和COCHLAN”1虽然将ANN应用于赤潮预测计算之中,但未在网络结构的优化方面做工作,而国内一些学者则在这一方面做了大量工作。蔡如钰。10。为了解夜光藻(Noctiluca scintillans)赤潮发生机理,根据董婧等。11。对海洋岛与王家岛周围海域的调查数据,选取水温、溶解氧(DO)、盐度、总氮、可溶性无机磷、浮游植物密度等指标作为输入指标,夜光藻密度作为输出,通过17组数据的小样本建立了6个理化因子与夜光藻密度3层BP的ANN模型,较好地反映了各种理化因子与夜光藻密度的非线性变化规律。吴京洪等。‘…则利用1998年4月份大亚湾澳头港实际监测数据,以采样深度、水温、盐度、 pH、DO、化学耗氧量(COD)、浊度、营养盐、叶绿素a、微量元素、总碱度、气温、气压、风速、风向、光照、潮汐、浮游植物总细胞密度等为参数,建立该海区浮游植物总量预报的BP神经网络模型,并预测了5月份水华的发生状况,取得了准确率为75%的较好结果。谢中华和晏丽红¨3。等基于渤海湾赤潮观测数据(2005年5月~9月),对藻类浓度与环境因子进行了相关性分析,从影响藻类浓度的15个环境因子中通过相关性分析和主成分分析选出了气压、盐度、风速、DO、时间及表层水温等对藻类浓度影响比较显著的6个环境因子,然后建立ANN模型,预测效果比较理想。上述研究初步表明,ANN用于赤潮生物生长的研究是一种行之有效的新途径,与传统统计模型相比有一定的优越性;然而随着人们对ANN的深入研究,BP网络仅仅基第5期吴风霞等:人工神经网络在海洋科学中的应用77于某一时期的数据来预测该时期的浮游植物密度,却不能达到对其后数值进行预测计算的实际预测效果,并且在训练样本不多时易产生“过拟合”现象,因而所建立的模型在预报时可能造成失误,因此,针对这些问题,一些学者在此基础卜又提出了基于遗传算法和基于支持向量基算法的一些神经网络模型。遗传算法是模拟生物进化过程的计算模型,王洪礼等。141首先依据经验对董婧等的调查资料建立了当天模型和预测模型,利用遗传算法对网络结构进行优化后,当天及预测模型的训练结果的平均误差分别为0.189、0.101,预测结果的平均误差分别为16.526、16.619,标准偏差分别为35.725、33.334(×104 cells· m。3),经比较发现,优化后模型在预测误差及网络结构复杂程度方面优于原预测模型,达到了真正预测浮游植物密度的效果。杨建强等。1引则将遗传算法和基于BP算法的ANN相耦合,采用3层网络结构,用遗传神经网络进行参加建模的参数和网络结构参数的优化,建立了辽东湾海域丹麦细柱藻(Leptocylindrus danicus)赤潮与环境因子之间的ANN,取得了较好的预测结果;同时对各环境因子与赤潮成因之间的关系进行了分析,得知温度、盐度及DIN的变化是赤潮发生的主要诱因。“支持向量基”算法既能处理非线性数据,又能有效地限制过拟合,在文字识别、语音识别等方面已卓有成效,因此,陆文聪等【16。尝试着应用支持向量机回归算法再次对董婧等的调查资料进行数据挖掘,不仅总结了所研究海区赤潮发生与环境因子的对应关系,而且所得结果表明支持向量回归的预测误差比BP网络小,又为赤潮发生机理及预报的探索研究提供了新的途径。因此,ANN用于赤潮生物预测的研究是一种行之有效的新途径,优于传统的预测方法,具有较强的模拟预测能力及实用性,值得进一步探讨。今后,继续需要做的工作是将ANN和赤潮生物的生长机理结合起来,同时加强对赤潮发生前后进行长期监测,积累完备、充分的数据,建立不同赤潮种类生长规律的预警系统,进而为赤潮的预防和治理措施提供依据。2.2ANN在海水质量评价中的应用近年来,随着沿海经济的迅速发展,排入海水中的氮、磷污染物逐年增加,水体富营养化趋势日益加剧,近海生态环境遭到严重破坏,海洋渔业和养殖业遭受巨大的损失。水体质量的评价方法是现代环境科学基础理论研究的重要课题,国内外学者对此提出了诸如灰色聚类法、模糊聚类分析法、模糊数学法、灰色局势决策法和综合指数评价法等¨7。1…。但由于影响海水水质的因素很多,且评价指标与水质标准等级之间是复杂的非线性关系,这些评价模型存在很大的不足。ANN克服了传统分析过程的复杂性以及选择恰当模型函数形式关系的困难,对非线性系统的预测具有独特的优越性,被广泛应用于海水水质评价的研究中。王冬云和黄焱歆四3通过运用多层前馈神经网络模型和BP算法对中国某海域的水质富营养化水平进行了评价,选择COD、无机磷、无机氮、叶绿素a浓度及浮游植物细胞丰度等5种指标作为海水富营养化的评价指标,将海水质量标准为输出,根据该海域的水质监测结果,利用训练好的网络进行推断,计算简便、快速并具有实用性,评价结果也较其它方法客观。国内许多学者对长江口及邻近海域应用ANN进行了水质评价研究。苏畅等。2川根据2004年4个季度对长江口及其邻近海域的调查资料,以COD、DO、活性磷酸盐、溶解无机氮和叶绿素a等5个主要指标作为评价因子,利用BP神经网络模型对长江口及其邻近海域的富营养化现状进行评价,通过比较发现,BP神经网络模型得到的评价结果较传统的分析方法更客观、合理及准确。楼文高。22。则通过在各类海水水质各污染指标的浓度区间内生成随机分布样本的方法生成足够多的样本,应用BP的ANN建立了用于海水水质评价的ANN模型,并根据海水水质标准给出了区分不同类型水质的模型分界值样本和模型输出分界值。研究结果表明,新的评价模型不仅能方便地应用于海水水质的分类研究,而且能够较精确地分析与评价海水水质。在水质评价标准基础上,杨红和李日嵩旧3。选用3层BP神经网络,以DO、COD、磷酸盐、总汞、无机氮、镉、砷、油类等水质参数作为输入层神经元,以相应的5种水质等级为基础生成期望输出,建立长江口水质BP网络模型;利用2000年8月份国家海洋局东海分局的调查资料,对长江口附近海域的18个站点的海水水质进行现状综合评价,取得很好得评价结果。海水质量评价的ANN方法近来被广泛使用,但是采用BP神经网络建立水质模型却存在两个主要问题:首先,训练样本不足,计算精度不够;其次是神经网络结构太大而出现“过拟合”现象,这都影响模型的泛化能力和预测能力。鉴于此,王洪礼等‘24 o尝试利用支持向量机(SVM)算法对海水水质富营养化的程度进行评价,确定COD、无机氮、无机磷、叶绿素a和浮游植物细胞丰度等5种指标作为海水富营养化的评价指标,根据海水质量标准和研究结果,制定评价标准,然后选择样本数据集,利用SVM进行学习训练,最后只需把相应的实际观测数据提供给程序,利用计算机分析计算就可获得评价结果,较好地解决了小样本的分类评价问题,评价效果良好,为海水预测提供一种新的途径。总之,海水质量评价是典型的模式识别问题,影响水质的因素很多,ANN能成功应用于海水质量评价,与传统评价方法相比,该方法计算简便、快捷、精度高,具有较大的实用性,而且避免了模糊综合评价和灰色聚类等方法权重赋值和隶属函数确定中人为因素的影响,减少了评价78南方水产第4卷过程中的人为主观因素,使评价结果具有客观性。2.3ANN在海洋预报中的应用海洋灾害,尤其是台风暴雨、风暴潮等灾害与人类的生命和财产息息相关,因此,准确的海洋预报一直是海洋科学中的热点和难点。但海洋气象预报的难点在于产生海浪的风本身具有很大的随机性和复杂性,造成海浪的预报十分困难。ANN具有较好的自适应学习和非映射能力,比较适合处理那些物理机制复杂,因果关系和推理规则难以确定的非线性问题,因此,可以运用到海洋气象预报中。目前ANN在天气预报方面已有很多尝试,取得了不错的效果。因此,针对台风预报问题,冯利华旧纠尝试初步应用ANN预报了中国东南沿海地区一次登陆台风所造成的最大24 h暴风雨量,以台风暴雨中心当日8 h700 hPa位面的上升速度、台风暴雨中心5个纬距范围内500 hPa位面平均24 h变温、台风暴雨当日8 h700 hPa位面佳木斯、哈尔滨、长春、延吉的温度与露点差之平均值作为变量,暴雨量作为输出变量建立了BP神经网络,拟合及测试结果良好,并且预报值的平均相对误差e只有9.09%,最大相对误差i只有一12.80%,与传统的直线回归模型计算的预报值的;=35.53%,e一=96.63%,可见神经网络模型的计算结果优于直线回归模型的计算结果。由台风产生的海浪,特别是波高大于4 m的巨浪,常常给国民经济和国防建设带来极大的影响,因此,开展科学合理的灾害性海浪预测方法研究是非常重要的,特别是海浪灾害的长期预测研究。李未等Ⅲo利用BP神经网络,建立了两测站台风暴潮和天文潮的综合增水效应预报模型,预报结果与实测值吻合较好,取得了一定的成果。与此同时,对海洋灾害预测的长期研究也是非常有意义的,陈希等。2¨利用湛江港附近硇洲岛海区近30年的海浪观测及相应时段的台风资料,经分析得知台风中心离预报海区的距离、台风风速、预报海区的风速及7级大风半径是预报台风浪的关键因子,把它们作为输入因子,台风浪的浪高作为输出建立了较为理想的台风浪BP神经网络预报台风海浪,取得了较好的效果。然而ANN在预报建模中存在“过拟合”现象及泛化能力不高等问题,因而黄海洪和孙崇智m1将ANN与主分量分析相结合,建立了北部湾冬季强风的主分量神经网络预报模型。该模型不但没有过拟合现象,而且预报精度也较高,历史样本风速拟合平均绝对误差为1.80 m·s~,独立样本风速试报的平均绝对误差为1.46 m·S~,并且网络规模越小则预报模型的预报性能越好。尽管上述ANN在海洋预报探索中取得了很好的成果,但还不能算是真正意义上的预报模型,作为一种探索,预报因子的选取、模型的建立以及预报个例的检验等方面还有许多值得完善、改进之处,还有待于进一步探索、研究。因此,BP的ANN方法由于其优越的非线性映射力而被广泛地应用于各预测研究领域,对于海洋预报具有很好的应用前景。2.4ANN在初级生产力预测中的应用海洋初级生产力是海洋初级生产者通过同化作用将无机物转化为有机物的能力,而海水中叶绿素a浓度是衡量水体初级生产力和富营养化状况的一个重要参考指标。准确探测海水叶绿素a浓度并分析其时空分布变化特征,对。海洋生态研究、海洋生物资源评价、海洋环境监测、海洋渔业管理等方面都具有重要意义。然而,传统的”C等测量方法无法实时快速地实现海洋初级生产力监测,并且海j二作业成本十分昂贵。随着海洋水色遥感的发展,遥感方法与实测资料相结合使海洋初级生产力的遥感估算方法得到了广泛的应用。KEINER和BROWN。29。根据水色卫星(SeaWiFS)接收到的数据,以水质参数作为神经网络模型的输入变量,叶绿素a作为输出变量,利用3层BP模型估算海洋叶绿素a的浓度;SCARDI。3叫也使用ANN方法估算了初级生产力,两者均对该算法的精度与其它常用的传统计算方法的精度进行了比较,均比传统的多元线性回归方法要好。尽管ANN方法取得了很好的效果,但缺乏可靠的固有光学参数的模型,因此,张亭禄和贺明霞日1。基于3层BP神经网络基探索了海中一类水体叶绿素a反演,将现场测量的遥感反射比数据分为训练样本(70%)和试验样本(30%),其得到的结果优于3次经验算法,且具有很高的计算速度。为了有效利用不同波段的光谱数据,改善反演一类水体叶绿素a的精度,王迎强和严卫‘32。则将主成分分析与BP神经网络相结合,对3层BP网络输入空问进行主成分分析,提高了反演一类水体叶绿素a浓度的准确性。然而由于二类水体的物质组成与光学特征比一类水体复杂,一类水体的研究方法对二类水体叶绿素a浓度的反演值常常严重偏高,因此,二类水体的反演需要更复杂的算法。沈春燕等¨列利用2003年1月、2004年1月在珠江15海域二类水体中的叶绿素a浓度和辐射同步实测资料,以SeaWiFS所设的前6个波段的遥感反射率为输入,以相应的叶绿素a浓度为输出,以双曲正切函数作为神经元的激励函数,建立了反演珠江口海域叶绿素a浓度的3层BP神经网络模型,并与传统的统计算法做了比较,研究结果表明,利用神经网络方法反演得到的珠江口海域的浓度与实测值比较,均方根差是0.2899,可决系数是0.8848,而传统方法的结果分别是0.5635和0.5570,反演精度明显高于传统方法的反演精度,ANN模型的反演结果则比较合理。詹海刚等惮。同样利用3层BP神经网络模型,反演叶绿素a浓度,结果同样表明神经网络的反演结果好于统计算法的结果。第5期吴风霞等:人工神经网络在海洋科学中的应用79尽管很多学者已经利用ANN方法成功地反演海水叶绿素a浓度,但是随着新一代高精度传感器的发展,利用ANN方法建立适用于初级生产力反演的区域模型,更准确地估算各种因子(如叶绿素a、温度等)将成为该方面研究的热点。2.5ANN在渔业资源评估中的应用传统的渔业资源定量预测评价方法主要是多元统计方法和数值模拟法,但预测结果往往与实际情况有一定的偏差。而ANN通过自学习、自组织,经训练后可用于资源量的预测与评价,已有不少成功的实例。AOKI和KOMATSUL35。与KOMATSU等。3¨将BP神经网络用于分析和预测日本中部的太平洋海岸Joban—Boso海区沙丁鱼(Sardina pilchardus)的冬季产量,利用1972~1992年的数据,以生物学、水文和环境因子共15个参数作为输入层,平均绝对误差小于8.4×104t,取得了良好的预测效果,证实了ANN用于资源量的预测与评价是可行的,为ANN进一步应用于渔业资源其它方面的研究奠定了基础。ROBERTSON和MORISON"叫则通过3个BP神经网络模型鉴别鱼的年龄,其对金鲷(Pagrus auratus)和布氏棘鲷(Acanthopagrus butcheri)、蓝尖尾无须鳕(Macruronus no— vaezealandiae)的平均训练相对误差分别为小于0.4%,4%,而测试相对误差则分别为0.35%、0.32%和0,0.26%、0.02%和0.07%,4.92%、7.17%及7.78%,取得了好于一般多元统计方法的良好结果。上面仅讨论了ANN在海洋科学中应用的几个重要方面。今后ANN在海洋科学中应用前景相当广泛,特别是在渔业资源综合管理与保护、渔业生产系统的自动控制与故障诊断以及鱼类共生系统的优化配置与管理等方面也将得到很好的应用,并将成为在海洋科学中的主要应用领域‘38。39]。3ANN的局限性及发展趋势自20世纪80年代以来,ANN无论在理论研究上,还是在实际应用中,都取得了突飞猛进的发展。但也存在许多不足之处。(1)大多数ANN模型的性能在很大程度上依赖于学习样本的数量和质量好坏,在实际建模过程中可能由于一些不当的假设或忽略一些相关因子而影响模型的精度,使ANN模型的结论可靠性和客观性降低;(2)由于ANN是对人类大脑结构和功能的一种模拟,缺乏泛化或者是外延效果较差,即使输入的是精确的信息,也不能得出较好的模拟效果。为了弥补ANN的上述局限性,有些学者从一些新的角度来改善ANN的应用,把模糊数学、数学逻辑、拓扑数学等方法结合到ANN的学习规则中,将ANN与专家系统相结合,实现符号处理与数值处理相结合,使知识的提取、存储、推理和解释更接近人脑,并把不同类型的ANN模型以不同的形式组合在一起,构成一个新的综合性ANN系统,使ANN具有求解诸如不确定性、模糊性和似然性推理之类问题的能力㈣J,解决海洋科学中大量存在的不确定性和模糊性问题。随着ANN深入研究,ANN必将会得到越来越广泛的应用和迅猛发展。参考文献:[1]金龙.神经网络气象预报建模理论方法与应用[M].北京:气象出版社,2004.[2j唐成友,官学文,张1:!=}明.现代中长期水文预报方法及其应用[M].北京:中国水利水电出版社,2008.[3]苑希民,李鸿雁,刘树坤.神经网络和遗传算法在水科学领域的应用[M].北京:中国水利水电出版社,2002.[4]沈倩,胡德文,时春.神经网络应用技术[M].长沙:国防大学出版社,1993.[5]高隽.人工神经网络原理及方针实例[M].北京:机械工业出版社,2007.[6]周开利,康耀红.神经网络模型及其MATLAB仿真程序设计[M].北京:清华大学出版社,2005.[7]RECKNAGELF.ANNA—artificial neural network model for predic— ting species abundance and succession of blue—green algae[J].Hydrobiologia,1997,349(1/3):47—57.[8]WILSONH,RECKNAGELF.Towards a genetic artificial neural network model for dynamic prediction of algal abundance in freshwa— ter lakes[J].EcolModel,2001,146(1/3):69—84.[9]KUDELARM,COCHLANWP.Nitrogen and carbon uptake kinet— ics and the inflHence of irradiance for a red tide bloom off southernCalifornia[J].AquticMicrobialEcol,2000,21(1):31—47.[10]蔡如钰.赤潮生物密度与环境因子的ANN网络映射预测模型[J].福建环境,2001,18(3):30一32.[11]董婧,刘海峡,李培军.海洋岛与王家岛周围海域赤潮生物夜光藻生态初探[J].海洋环境科学,1999,12(2):28—31.[12]吴京洪,杨秀环,唐宝英,等.人工神经网络预报浮游植物生长趋势的研究[J].中山大学学报:自然科学版,2000,39(6):54—58.[13]谢中华,晏丽红.赤潮预报的人工神经网络方法[J].海洋技术,2007,26(2):31—33.[14]王洪礼,沈菲,冯剑丰,等.基于人工神经网络的浮游植物密度预测模型研究[J].气象水文海洋仪器,2004,4(3):26—29.[15]杨建强,高振会,孙培艳,等.应用遗传神经网络方法分析赤潮监测数据[J].黄渤海海洋,2002,20(2):77—82.[16]陆文聪,杨柳,双菊荣.支持相量基算法用于夜光藻密度建模[J].计算机与应用化学,2002,19(6):706—708.