网易科技讯 11月2日消息,2009中国互联网大会在北京召开。互联网资产价值研究论坛同期举行。海博智讯软件公司首席架构师蔡亮华在会上介绍了互联网价值实时分析系统创新与研究。
蔡亮华指出,互联网资产越来越受到企业,以及投资机构和社会大众的支持,包括他们的关注以及重视。企业在整个互联网上的投入,所形成的各种影响力,包括域名、网站功能开发、用户数量的开发、访问量的增加、交易量的增加、知名度、品牌形成等等越来越大。
蔡亮华同时表示,随着互联网资产价值逐步的受到社会和企业的认可,研究开发出种针对互联网企业价值公正、开放、透明科学评估体系成为互联网行业发展的必然。
以下为演讲实录:
【蔡亮华】各位领导,各位来宾,各位专家,大家下午好!刚才课题组我就很荣幸代表这个课题组做一次关于互联网资产价值实时分析系统的报告,希望这个报告能够引起我们互联网界的关注和重视。
互联网资产我们已经听到很多专家和领导的发言,我们感觉到这个互联网资产的确非常的复杂,里面包含了非常多的内容,以及很多的资产评估的方式。我们经过在万网的的主持和关心下,在互联网协会的大力支持下,我们通过接近半年的努力,开发了这么一套测试版的系统,今天首次在互联网大会上亮相,希望得到业界的关注,以及对我们系统提出更多的批评和建议。
刚才很多领导和专家都已经讲到了互联网资产的一些意义,首先我这里面简单的回顾一下关于互联网实时系统的分析以及意义。第二展示一下我和我们团队半年内开发的系统是怎样进行工作的。第三我们会强调提出关于我们课题组当中所需要关注的一些课题。第四介绍一下关于系统当中落实用的一些技术。
我们前期工作所体会到的论坛,我们总结一下关于系统开发的背景。
第一,互联网资产越来越受到企业,以及投资机构和社会大众的支持,包括他们的关注以及重视,所以我们第一个背景这是一个非常必要的行为。
第二,企业在整个互联网上的投入,所形成的各种影响力,包括域名、网站功能开发、用户数量的开发、访问量的增加、交易量的增加、知名度、品牌形成等等。
第三,互联网成为企业有效资产的延伸,尤其对互联网资产评估发生上市、并购等行为给投资机构以及资本市场所有认可。但是现在我们可以看到关于对互联网资产的科学分析、计算方法,以及评估的标准还没有形成公认的规范和体系。
第四,随着互联网资产价值逐步的受到社会和企业的认可,研究开发出种针对互联网企业价值公正、开放、透明科学评估体系成为我们互联网行业发展的必然。
我们可以看到,我们开发的这个系统已经在互联网运行了三个多月,还没有正式公开。我们现在就以万网为例对网站所采用的技术进行简单的介绍和分析。
刚才我们看到的是全国有几十万年,甚至上百万年企业,我们举万网的例子只是抛砖引玉,看一下互联网实时分析系统到底分析了哪些指标。
互联网资产分析系统的整个模型是建立在于万网与互联网协会研究和分析系统之上的,我们可以清楚的看到所有互联网的资产分别有两个纬度,互联网资产首先会有一个最基础的功能就是电子邮件,电子邮件是企业最先接触的互联网产品,标志着互联网决策的建立,第二个是互联网的网站,用于企业介绍自己的产品,同时建立与外界相互联系的通道,第三开始建立网上交易的模式,网上交易的话需要企业有在线的方式销售自己的产品,同时实现支付。第四个网上电子流的实现,通过电子流实现企业内部和外部的一种自动化,最后采用新技术,能够解决传统行业、企业所不可能,或者很难解决的一些问题。
我们在分析和建设开发这个系统之前,我们首先和互联网行业专家,包括企业的一些领导和一些在校的教授们一起分析了一下关于互联网的组成架构,互联网资产一般可以定义为硬性资产和软性资产两个方面,我们这里所采纳的50%只是一个初始的限制而已,硬性资产有63个指标,软性资产有38个指标,互联企业在互联网当中所获得或者所得到的影响力排名,交易的数额得到的品牌价值。
我们来看一下关于在网站当中的左下角图,这张图互联网综合指数雷达图。分别是受关注度、功能指数、域名价值指数、媒体影响指数、网站的友好度指标、企业的品牌形式指。
围绕着这五个指标的话,分别通过一种科学的计算方式能够得出一个综合的数值来,我们这里简单的看一下关于功能网站指标里面所包含的一些内容,重要的内容我们这里简单的做了一个演示。
企业在网站功能当中的话,包括网站、邮箱、电子商务、社区、QQ、IM这种功能是不是存在,包括友好度指标是不是有一些相关的缓存等等,媒体的影响指数有多少个媒体能够报道你的指数,包括你媒体的量级是多少?是中央媒体,还是地方媒体,还是行业媒体,各方面都会成为计算的一个重要的指标。媒体的关注度也是通过引擎的搜索数,网上的各方面的表现,政府、社会、学者、专家们对你的评价,包括对危机处理的能力,还有域名价值,我们刚才看到很多专家已经提到,我们不再多说。
品牌形象以及互联网涉及的人、产品、机构、人群、媒体、合作指数、交易指数、企业的股权指数,因为有很多企业属于上市公司,包括电子商务和互联网给企业带来的营收情况。
这里清楚的表现出来企业互联网价值别有哪几个部门组成,硬性资产价值分别由网站的功能、域名的价值、友好度指标三个大的指标组成。网站功能有20多个指标,域名价值一共有14个指标,友好度指标有29个,这是硬性的指标。软性资产的话,有媒体的影响指数、受关注度、品牌形象所组成,分别有七个指标,14个指标和17个指标,这是我们这里所能够给大家展示出来这套系统所能够运行一些指标数。
我们可以看到这里有一大堆柱形图,这里面有百度的收入数是多少,雅虎的多少,正面形象指数,负面形象指数,以及网站的人气指数、互联网流量指数、网站优化图。合作指数、价格指数、企业的股权指数,企业的规模指数,企业的营收指数、政府关注度、专家关注度分别由这些指标组成互联网企业资产评估的指标。右边分别有关注度、功能性指标、域名价值的一些评价情况,我们看到域名价值,域名的长度多少,是中文的还是英文的,还有域名历史长度,历史年份是多少,我们可以看到万网的年份已经达到10亿。我们通过这些指标可以通过一个专利技术,这个专利技术已经通过国家专利局的初审,关于对所有这些指标所提出来的关于领域的定价技术,是面向所有的指标对象相关信息,按照语意的数据来测量。并且在这个基础上对语义的挖掘。这是第一个技术的简单介绍。
第二个话,我们可以看到,我们最右边会出现一堆与互联网资产价值相关的一些数字,这些数字分别来诠释这些数字的来由,我们可以看到互联网品牌形象和相关人,当我们输入万网这个词,准备对万网互联网资产进行实时分析的话,互联网会自动跳出张向东等等,是他们出现最多的词,与互联网相关的词是什么?计算机会自动分析出排名前八个数字,万网、互联网、域名、资产、上市、主机、降价、建站。对于互联网电子交易的产品,这套系统又会自动的出来邮箱、服务器、虚拟主机、建站。涉及的行业是互联网、IT,互联网里面还涉及到其他的机构,所以我们看到出现最多的狼烟科技和阿里巴巴,互联网品牌涉及到很多用户群,最多的是副总裁、总裁和站长。报道万网这个企业最多的分别是中国中央电视台、和讯、中国新闻网,还有对于万网这个正面和负面情况的报道情况,计算机也会算出相关的数字,这个技术是基于专业的语义库,以自学习的方式,会不断的更新和修正自己的语义库。
举个例子来说,我们抓到“苹果”这个词的时候,出现的词,第一个是公司,第二个是水果,减肥期间。第三个是MP3,第四个关于苹果电影被封杀的消息。计算机会做出自动判决,基于词频的聚类的技术实现了词语的科学分类和科学解释。把基于现在的互联网的一些信息采用具有自学型语义库进行动态的调整。
截止到我们今天为止,我的团队给我的数据目前这套数据库仅用了5个月的时间已经超过了语义种类超过29万个,语义的数量已经超过145万个。我们可以分析一下百度和Google多少。
我们会得出一个结论,中国万网的互联网资产价值图,以月为单位的曲线图到今年的8月份开始,我们不清楚万网发生了什么,8月份开始这套系统使得万网的互联网资产出现了一个短震,到后来才知道是万网和阿里巴巴合作。万网的价值曲线和中国互联网三百价值指数的比较,中国互联网三百指数分别有点像采用了中国股市的三百指数,企业三百指数,分别采取了一百个高位的企业,一百个中位的企业,一百个低位的企业,我们可以看到中国万网的企业值是超过了这样一个数字。
这样一个数学模型基于这么多的软性指标,甚至于都是一些好象我们说不清它到底是好还是不好的指标,它怎么样进行计算,我们采用基于神经出来的数学模型。这个技术的原理大概是这样,我们相当于一个人脑,分别经过了小学、中学、大学的学习,知识的积累,加上家庭环境,你的父母亲、兄弟姐妹给你的信息,再加上你社会环境,再加上你自己本身的潜意识形成了现在的头脑。我们这套系统采用这样一个模式,如何建立属于互联网资产价值生活版模型呢?我们分别将网站的各项指标,网站的各类信息内容所聚类的各种信息,网站内容所带来的影响力信息输入到这样一个系统里面去,通过这个系统的神经网络模型对各种信息规律进行了一个自动的聚类和收集,海量的学习,价值的分析计算,从而得出来这个企业互联网资产的模型,每一个企业都是不同的模型,每一个企业就像每一个人一样是完全不同的模型,这是模拟生物计算机的系统。
我们可以看到对于神经网络里面来说有两套模型是我们计算机会自动采用的,针对不同的企业,它会自动的选择不同的模型,一种模型是前向网络模型,第二种还有反馈带来新的模型。举个例子来说由A和B得到C,反过来说由C就会影响到A和B。我们计算机会权重影响对这个人所带来的价值变化,一个企业也是一样的。
这套模型把每一个神经元拿出来以后有多层的结构,分别有一个神经元会有多个输入,我不知道消息对它来讲属于政府对他的评价,还是属于社会大众对他的评价,是表扬还是批评,计算机会做出判决。计算可以通过每个神经元方程,第二个通过一个设计计算。
通过这样的数学模型以后会得到很多这样的新闻,所有的客户会通过这样的品牌可以看到比方说涉及到与万网与张向东相关的消息,我们从这里可以很清楚的看到万网与张总的消息在这里会体现出来,万网与狼烟科技是怎样的消息,我们点击狼烟科技与万网机构所有的消息,不管出现在任何一个媒体上,这套系统都会把它抓下来,不需要找门户,这一个网就够了,他把所有万网与狼烟科技所有的关系收集下来进行计算你可以看到相关的消息从哪里展示出来的。我们也可以看到属于报道万网所有消息也都可以在这个网站上看出来,来自于所有的网站都会一一的展示出来,会给所有的企业非常精确的值,这个值所有在中国报道它的媒体分布情况,这是一个实时的数字,每时每刻在发生变化,这个变化可以给企业一个市场营销的机会。比方说我可以看看赛迪网怎么报道万网,我们可以看到赛迪网和万网之间报道的消息是什么?我们随时点击任何一个点就可以浏览它的内容,即使这个内容已经被Google或者百度封杀掉,对不起这个网站可以忠实保留这个内容。
这个技术在其他的地方怎么应用?这个技术其实已经获得很多运用,这个系统对人的价值评价当中也可以同样的结果,基于这套技术我们给娱乐界所有明星们做了一个价值排行榜,我们可以看到广告价值的排行榜,广告的价值跌行榜,绯闻价值榜等等都会实时的展示出来,这些展示犹如我们在企业、互联网资产评估中可以得出一个结论。比如说周杰伦最近的发展情况怎么样,与周杰伦相关的品牌、地区统统都可以得出一个非常明确的答案。他所经历的价值指数可以看的很清楚,他一个月的涨幅情况,一年的涨幅情况,他在媒体曝光以及所获得价值计算情况。
基于这套体系我们还可以做出很多的排名,我们可以看到类似于很多的排名都是来源于神经网络计算技术,这里面还可以看到基于这套系统做出非常成熟的股票实时分析系统,利用这套技术已经为我们中国的财经机构建立了一套非常详细的针对中国的股票和中国的财经专家进行的一个网站,这个网站将中国财经人士历史记录和现在的水平进行综合评价,这些状况根本没有人的参与,完全是计算机自己完成的,可以达到公正性。
这里所展示出来的是说和大家分享的这套系统实际上所采用的技术在其他的领域已经获得应用,而这些应用在很多企业,很多的行业里面已经是一个比较成熟的运用。
它的成交量的排名、每天排名、超大盘的排名情况你就可以选择自己需要的股票,自己所追随的股票经纪人师是谁?
我们还可以做到对企业危机的预警,同时对企业危机的预警,包括企业所建立的一些数字,它所相关这个企业所发生一些事情,涉及一些地区、机构通过都可以通过这样的系统完成。这是企业上线实时一些模型。还可以对企业完成对社会影响力的模型,对一些集团企业一些市场检测报告。
基于这套技术所完成的这些功能的话,我们认为在完成了我们理论研究和思想体系以后的话,可以为中国互联网资产价值的分析提供一个科学的分析依据。
这是我们看到给中国移动所做的对市场检测的模型,所有的模型都是由中国移动集团所设定的一些规则,可以看到相关的信息和报道,包括数据、网络、企业领导人形象、正面形象、负面形象,以及其他的新闻危机报道都会得到一个论证。
我的演讲到此结束,谢谢大家!