机器人没有情绪吗?AlphaGo 要被李世石逼疯了!

围棋人机大战进行到第四局,场面显得有些尴尬,李世石似乎没有人们赋予的那般神奇,因为他已经被AlphaGo连续3场KO,而在距离赛事结束只有20分钟的时间,李世石还处于被AlphaGo 逼着走的状态。这情形着实让人恐慌,人工智能真的如此淡定的要将人类彻底打败吗?代表人类出战的李世石被世人冠以过高的殊荣,此刻心里阴影面积也是难以计算啊。 机器人不受情绪影响吗? 然而,赛事的最后20分钟,剧情骤然反转,李世石一手扭转乾坤的妙招导致AlphaGo情绪崩溃,为全人类挽回些许颜面。 原来李世石在第78手向敌方腹地一“挖”,让AlphaGo “抽疯”,导致系统出现严重bug,使得AlphaGo连续下了好几手臭棋。 此前,媒体一直报道分析,机器人能够很淡定的应战是因为它没有情绪,能够清醒地根据每一招的胜算概率下棋,所以失误率几乎为0。而李世石背负着人类太多的情绪,太大的压力,所以情绪很容易受影响。可是,反观第四场,机器人因李世石神奇的一步棋直接导致系统崩溃,出现严重的错误。这难道不是情绪受控吗? AlphaGo被李世石的精妙棋艺逼到“自暴自弃”,戳中其弱点:劫争。前几场的胜战是因为机器人有算法控制其避免劫争,然而当对手影藏招数使出时,机器人的内部运算不过来就会被逼疯,直接出现情绪失控。 具有认知功能和情绪的机器人 其实,具有认知功能和情绪的机器人才是我们所追求的,能够为人们服务的智能机器人。在这方面,机器人察觉和回应某种情绪的能力至关重要。那有没有一种程序设计出来让机器人感知人类的情绪呢?或许认知功能和察觉情绪并不会让机器人变得更加智能,但是我们的感觉却是如此,因为它让人与机器人的相处变得更加方便。 西班牙格拉纳达大学研究团队负责人卡列哈斯·卡里翁表示,这并非不可能,但确实是一项不小的挑战。情绪就好比各种 颜色。虽然你已经有原色,但还可以将它们混合起来。现在已经有了能够识别一些基础情绪变化的系统,比如愤怒和喜悦等。但是更加复杂的情绪,如嫉妒等则需要 在认知功能方面进一步提高。 利用一些可识别表情并分析声音,甚至可测量心跳、皮肤温度或血压等的设备,通过手机或者配套的设备将数据传输到机器人研究数据库,把这些信息来源收集起来进行分析确实可以帮助人类研制出能够识别情绪的自动化系统。自动化识别情绪系统诞生,不久的将来,能够认知,甚至耍情绪闹脾气的智能机器人将来到我们身边。 来自: 旗瀚科技

全球首个股权投资机器人面世 相当于有3~4年经验的投资经理

2016-04-17 大数据实验室 近日,首个股权投资机器人在北京亮相。因果树联合创始人滕放表示,投资机器人的投资水平相当于有3~4年投资经验的投资经理。 对于因果树投资机器人如何对股权市场进行投资分析,因果树创始人马超表示:首先,机器人会抓取全网13万+互联网公司的信息,建立关于互联网企业投融资信息的完备数据库;第二,机器人会每日跟踪并分析全网项目动态,记录企业成长轨迹;第三,机器人会对项目分析建模,具体为机器人使用标签云来分析项目的商业模式,并对项目进行归类,然后根据行业热度、机构热度、项目本身情况进行建模,对项目进行综合评分;第四,机器人通过模型运算,最终推选出近期最具有潜力的 企业。在这个过程中,投资机器人加大了信息半径,通过对所有过往项目的回归训练来进行投资建模。 此外,投资机器人具备情感逻辑能力,对优劣信息会加以处理。马超表示,互联网的特点就像水一样,一定是流动、透明、利他、共享的。因果树投资机器人的目标就是要建立流动的数据流,让行业信息更对称、更透明。 滕放称,投资机器人1分钟的工作量相当于一个成熟分析师40小时的工作量。在认知程度上,因果树投资机器人的水平相当于有3~4年投资经验的投资经理的水平。 滕放认为,人工智能投资的根本是为了让股权流通更高效。目前,人工智能投资仍处在起步阶段,在技术、模型上还有很大进步空间,但是人工智能在金融领域的运用,必将能够打破传统加法增长的规律,重构整个一级股权领域的生态,实现指数级别的增长。 对于股权投资机器人的面世,中关村股权投资协会联席会长兼东方基易投资管理公司董事长易基刚表示,中国股权投资的体量还很小。主因是信息不对称、不透明,没有定价标准。投资经理一对一跟踪项目需要非常多的时间和精力。人工智能在股权投资领域的应用提高了整个一级股权市场的效率,让项目价值有了判断依据,让一级股权市场的量化投资成为可能。 来源:证券时报记者 作者:顾哲瑞

大数据营销与普通营销的区别

时间: 2016-05-11 11:49:03 这个时代搞营销就像是在做一道未知口味的超级大蛋糕,而营销手段就好比不同的口味的配料,随着个人的喜好不同,配出的味道也将会不一样,但这个蛋糕终归是要拿到桌面上去品尝,所以在海量的人群信息中如何具有针对性的让潜在客户看见并接受呢?答案就是大数据的运用。随着移动互联网的发展和移动智能设备软硬件功能的不断完善,网民使用习惯发生了巨大变化,用户行为方式从传统的PC端为主转变为“PC端+移动端”并重,呈现出跨屏互动的趋势,至此大数据的作用也日益明显起来。然而对于大数据及营销你真的了解吗?它到底有哪些价值?又有哪些问题呢?下面8句话告诉你什么是真正的大数据营销。 1 大数据营销让一切营销行为和消费行为皆数据化 数据流化使得营销行动目标明确、可追踪、可衡量、可优化,从而造就了以数据为核心的营销闭环,即消费——数据——营销——效果——消费。 新意互动策略中心总经理邓继民表示,大数据营销的价值无外乎表现在两个方面,一是数字品牌,二是效果营销。而如何优化提升品牌数字资产,这是数字品牌发展的根本和核心。这里所指的数字资产不仅仅是传统品牌营销所指的知名度、美誉度,更重要的是品牌与消费共创的数字生态价值,从而实现数据的商业化,进行有效的导流和促进销售。 他认为品牌会把“数据”当成营销运营的核心部分,打造符合企业、品牌行业及企业、产品特质的更加深度的数据体系和数据应用。毕竟数据是海量的,如何运营有限、有效的高质量数据为企业更好的创造价值比大海捞针的粗放式玩儿法要实际的多。然而数字时代,一个品牌不仅仅在收集数据,同时也在制造和影响数据,如何塑造和运营更加有利于企业和品牌营销发展的数据流,必然成为今后品牌营销必须面对的重要课题。因为大数据不是目的,营销投入的关键在于产出,如何合理运用数据最大化影响营销投入的ROI才是最终根本所在。 2 大数据营销让社交网络营销等渠道更具价值 中传互动营销传播院院长于明认为,通过大数据抓取用户,让社交平台价值倍增,而大数据营销不仅起到了一个连接社交平台,精准抓取用户的作用,而且通过数据整理做营销后提炼大众意见去做产品,完成了社交平台营销中的最基础环节。这表现在,一个新产品的推广中,完全可以利用大数据来整理用户需求利用粉丝力量,设计出新的产品,而众多参与者就是最原始的购买群体,随之打开销售渠道。 3 大数据营销让广告程序化购买更具合理性 面对互联网媒体资源在数量以及种类上也在快速增长越发多样化,不同广告主的需求也在日益多样,越发意识到投放效果、操作智能的重要性。大数据是通过受众分析,帮助广告主找出目标受众,然后对广告投放的内容、时间、形式等进行预判与调配,并完成广告投放的营销整个过程。 传漾创始人及资深技术副总裁王跃表示,大数据营销未来趋势将向程序化购买方面发展,随着程序化广告发展热潮带来的效率提升,企业将会把越来越多预算放到程序化购买里。而大数据对企业来说,可以更加明确地知道自己的目标用户并精准地进行产品定位,从而做出极具针对性的布置,获得用户参与。 那么怎么衡量大数据网络广告价值呢?所谓的大数据营销不仅仅是量上的,更多的是数据背后对受众的感知,这体现在对大数据的规模,速度、挖掘及预测四个方面。另外王跃表示,对广告来说,产消逆转将导致头脚倒立的新型广告的出现。网络广告领域的探索颇具先见之明,其依托云端的数据库获取到海量可交互的结构与非结构化数据,并由最底层的数据分析平台支撑中上游的应用服务,打通PC和移动互联网的数据通道,逐步催生垂直的产业链形态。 4 大数据营销实现线上线下结合后进入多屏时代 “目前的数据挖掘更多还是停留在线上数据的分析和挖掘上。因此未来的关键点就在于如何能够实现线上线下数据的打通。一旦线上的数据和广告主的第一方数据相结合,大数据营销在更精准的基础上就会做到人群量的扩大,”悠易互通产品副总裁蒋楠表示,多屏时代的到来,正在把受众的时间、行为分散到各个屏幕上,而广告主想要更好地抓住消费者的兴趣点,就需要实现多屏的程序化购买。未来大数据营销的大趋势便是多屏整合下的数字营销。 目前大部分企业经营决策面临的最大挑战不是缺少数据,而是数据太多,数据碎片化,各自为政。许多公司组织中,数据都散落在互不连通的数据库中,并且相应的数据技术也都存在于不同部门中,面对这些静态、孤立、无多大参考意义的“初级品”的信息数据,企业信息部门只有将这些孤立错位的数据库打通、互联并且实现技术共享,才能够最大化大数据价值,提供决策支持。 5 大数据营销并非“量”的存在而在于“智慧的数字生态” “对于大数据营销的理解,多数人的理解停留在‘很大的数据’这一概念,然而大数据实际上是一种“数据生态”的表现,即从交易型数据管理拓展到社会化数据管理层次,从结构化数据管理拓展到非结构化数据管理等。在此基础上必须要有BI的商业智能分析模型的数据管理能力,否则无意义而言。”珍岛集团副总裁张蓬说道。 大数据营销等同于精准营销,或是精准营销是大数据营销的一个核心方向和价值体现。然而目前市场上很多大数据营销技能的企业存在很多片面性,首先整个SNS体系的生态数据应该是完整的数据展现而并非微博、微信数据平台等单一的数据支撑。其次,配套程度有限。大数据智能除了像EDM通道外,还需要和终端配合,这点目前市场上做的还很分散。最后,企业在做大数据营销时对个体消费群体真正能够接受大数据给自己带来的便捷同时也因为涉及“个人隐私”这个敏感的词汇而有所收敛。 张蓬认为大数据营销的两个核心方向是To B和To C。To B即商业智能化,涉及企业智能化供应链决策体系优化,这个供应链不是常规理解的传统意义的物流,而是囊括企业人力资源、服务采购、销售市场拓展、内控成本分析等诸多层面。To C,即生活服务,涉及餐饮、旅游、医疗等诸多领域,以个人信息为核心的信息组织管理模型,将在未来,重构民生体验。 6 大数据营销是“大规模个性化互动”实现高效转化的基础 大数据营销以DMP为核心,包括CMO辅助决策系统,内容管理系统,用户互动策略系统,效果评估与优化系统,消费者聆听和客户服务系统,在线支付管理系统等几个方面。主要从决策层,分析层和执行层几个方面来完成营销,服务和销售全流程管理。 时趣首席科学家王绪刚认为,在银屏时代,营销的核心是品牌形象传递;在互联网门户时代,营销的核心是数字化媒介购买;而在以移动,社会化代表的互联网3.0时代,营销的核心是实现“大规模的个性化互动”。这里的互动指的是更加广义上的接触点策略,比如更加有针对性的传播内容,更加人性化的客服信息,千人千面的个性化页面,而实现这一核心的基础就是消费者大数据的管理。大规模代表效率,个性化代表更好的转化效果。因此,所谓大数据营销的价值就在于能够实现更加高效的转化。 每个公司所处的阶段不同,关心的问题也不同。未来除了广告平台以外,品牌主会更加关注其消费者生命周期的数据管理,与平台合作,实现在多个接触点上的个性化沟通。因此,传统意义上广告策略将渐渐被基于对用户画像的自动化沟通机制所替代,而CMO也必须借助构建DMP,SCRM等IT设施来应对这一趋势。 7 大数据营销即建立一个数据建模让营销更加精准、有效 微播易技术经理林星认为,数据的获取方法主要体现在信息系统普及、传感器网路等等。其次是数据处理方法,像是使用通用计算机搭建计算能力超群的系统,如SNS社交媒体,利用更加开放的系统,在不妨碍平台利益和用户隐私的情况下,理论上获取每一个个人的SNS行为轨迹,然后存储在服务器上,形成一个庞大的数据库积累后成为大数据营销的一个数据基础。 目前在营销过程中涉及数据方面的多而杂,这时需要对数据的有效性进行过滤,例如行为噪声,重复数据,非目标用户数据等等。换句话说,大数据时代,数据和处理能力不再是主要矛盾,主要矛盾是如何从数据中获取想要的知识,也就是数据建模即挖掘能力。当然这个问题的求解,需要一些列建模的过程,然后把它转化成为具体的计算问题。 林星表示,目前的大数据技术虽然可以让营销动作做得更加精准、有效,但做起来并不容易。即便是公认大数据营销的大佬亚马逊、乐天,也经常会被吐槽推荐的东西驴唇不对马嘴,或者是已经买过的东西也会一再推荐。因此,未来基于大数据技术的提升,大数据营销的精准性将带来更多的商业价值。 8 大数据营销就是对“小数据”分析过程中的数据应用 对于大数据营销,多数人认为在做的事情可以称之为“大数据”,在众多乐观的态度中易观国际分析师董旭却提出了对立的观点。她认为,今天所有营销数据基本上是各家在利用有限的数据资源,虽然这个数据资源可能是庞大的,比如庞大cookie量,附属性的分析量等,但将其放在互联网、移动互联网环境上只是与营销相关的数据之一。因为现如今产业链的特征,企业都会有自己独立的DMP系统,但做DMP第三方市场还没有一个通用型的DMP平台可以提供获取数据。因此所有的DMP本身是在应用数据,而并非是全网的大数据。 另外,当今的所有的用户数据都来自于cookie或是APP使用行为等等,如用户属性,购买行为等,因其数据本身的局限性再从数据本身的一个维度的扩张来看今天的数据也够不成大数据。因为大数据营销还处在一个概念普及的阶段,所以大数据未来的发展方向是指导整个营销行业趋势化或并不指导实际运用的作用和价值,而真正指导这个行业运用的还是小数据为主。这也是为什么如今独立的第三方DMP生存并不理想的主要原因。 结语 大数据可以帮助品牌发现机遇,如新客户、新市场、新规律、回避风险、潜在威胁等,同时亦可以有助于品牌营销决策的调整与优化。这其中包含了数据人才、数据模型和应变数据管理的组织职能优化等,这也是当前企业大数据营销转型中最大的三个门槛。目前大数据营销的最真切的切入点就是去做内工层面,即概念普及认识数据的重要性,这其中包括:数据的活性,量级,数据的准确性,以及数据维度的多元化,最后交给市场一个教育的过程。

认知计算、人工智能和大数据分析有何区别?

时间: 2016-04-08 09:46:19 编辑: 西奥马尔编 对于认知计算(Cognitive Computing)而言,洞察和预测只是其中的一种。但是,认知计算更为强调人和机器之间自然的交互,这些维度都不是传统的大数据分析所强调。 认知计算是通过与人的自然语言交流及不断地学习,从而帮助人们做到更多的系统,是从硬件架构到算法策略、从程序设计到行业专长等多个学术领域的结合,能够使人们更好地从海量复杂的数据中获得更多洞察,从而做出更为精准的决策。在IBM,我们把它简化归纳为,具备规模化学习、根据目标推理以及与人类自然互动能力的系统。 认知计算与人工智能的区别是什么? 虽然认知计算包括人工智能的一些要素,但前者是一个更宽泛的概念。认知计算不是制造“为人们思考”的机器,而是与“增加人类智慧”有关,能够帮助我们更好地思考和做出更为全面的决定。 人工智能的概念已经有二十多年了,人工智能从历史和研究角度来讲主要目的是为了让机器表现得“更像人”,我们称之为Intelligent Behavior。 IBM的认知计算从技术角度上来讲和人工智能是有很多共性的地方,比如机器学习(Machine Learning)、深度学习(Deep Learning)等方面都很类似。 但是,IBM的认知计算目的并不是为了取代人,而Intelligent Behavior也只是认知计算的一个维度。认知计算除了要能够表现人和计算机的交互更加自然流畅之外,还会更多地强调推理和学习,以及如何把这样的能力结合具体的商业应用、解决商业的问题。 认知计算和大数据分析有何区别? 大数据分析属于认知计算的一个维度。与大数据相比,认知计算的范围更广、技术也更为先进。 认知计算和大数据分析有类似的技术,比如大量的数据、机器学习(MachineLearning)、行业模型等,大数据分析更多强调的是获得洞察,通过这些洞察进行预测。此外,传统的大数据分析会使用模型或者机器学习的方法,但更多的是靠专家提供。 对于认知计算而言,洞察和预测只是其中的一种。但是,认知计算更为强调人和机器之间自然的交互,这些维度都不是传统的大数据分析所强调。 此外,认知计算目前成长很快的一个领域为深度学习(DeepLearning),它的学习方法与传统方法不同,更多的是基于大量的数据通过自学的方式得到这样的模型,而不需要很多的人为干预,这个从学习方法来讲和大数据分析有很多不同的地方。

杨鸣:智能社会主义新思维(三):新常态下的智能化创新

现代社会新常态给人们带来许多困惑:虽然我们的虚拟网络生活越来越丰富,却是越来越脱离现实生活。我们所接触的娱乐多种多样,但很少能带来长久欢乐。网络新闻铺天盖地,然而我们对真理和信仰却更加迷惘。我们的技术越来越先进,工具越来越多,反而我们失于专精,成果出得越来越少。职场更是如此,长此以往,企业一直依赖熟悉的有形的资产来创造价值,提高竞争力。而在新常态中,企业却难以再依靠传统资源,如场地,原材料,劳动力和资本来获得竞争优势。在当今的数字化经济中,企业寻求增长和繁荣,靠的却是无形资产和策略。 何谓无形资产?在数字经济中,企业创造价值和竞争获胜靠的是流动的、不断发展变化的无形资产:如企业战略与定位,颠覆创新及先发优势,数据资源和管理能力,市场管理的无形之手,网络效应和外部环境,交易成本效率以及相关优势等等。这些才是数字化经济的活力因素,如果公司寻求的不只是生存,而是在新常态下发愤图强,就必须注重创新,增加无形的活力因素。 这些无形资产来自何方?究其根本皆来自创新。现代社会的创新文化支持人类的创新思维,使他们从知识积累中不断提取新的经济营养和社会价值,并通过产生新的环境,改进企业和社会的产品,服务和流程。健康的创新文化支持研究与创新,支持价值共享和信仰的相辅相成,支持全球性知识合作及智慧集成。 创新是社会性行为,虽有大有小,但人人都可以学到并参与,不只是社会精英所专有的天生才能,而是可以人人学会并应用的技能。在西方现代社会,创新被视为一个持续发展的过程,而不是特殊的,独立的活动。现代社会和企业组织注重创新型发展,例如,美国现代化企业把创新看作持续的企业文化和企业发展的力量源泉,把创新能力与质量、领导力、产量看得同等重要。他们的做法是:1) 建立好思路和新想法的管理与跟踪机制;2)启动各种信息交流研讨会,协调跨业务、跨部门的创新;3)寻找与具体创新任务(如:目标策划)相适配的创新顾问;4)把创新与其他关键工序连环相扣,包括财务,商务和技术引进等。 这些创新型企业更把创新视为系统与机遇,体现出灵活创新的风格,采用各种新发现并抓住机遇。比如:1)不断监测并发现企业内部的创新能手,让他们去带领新方案,逼他们落实于行动。2)头脑开放,对外界的好想法,他们会想方设法与内部的项目挂钩。3)不断试验新概念,做一事,进一步,从中学会很多东西;4)积极与思路相近的,互不竞争的公司合作,从中发现新的观念和趋势。 创新引领智能化时代的步伐。例如,人类早期机器思维方式向着当今智能思维方式和大数据思维方式转变,因而有效地推进了大数据时代的到来。随着物联网、云计算、社会计算、可视化技术等的突破性发展,智能化创新正在带动智能思维:大数据平台能自动搜索所有相关的数据信息,并进而主动、立体、逻辑地分析数据,做出判断,提供见解。这无疑也就具有了类似人类的智能思维能力和预测未来的能力。智能与智慧科技是大数据时代的显著特征,大数据时代的思维方式也要求人们从基于机器的自然思维转向基于信息的智能化思维,不断提升社会计算能力和智能化水平,从而获得具有洞察力和新价值的东西。 本文中社会智能化的定义是以智能(SMART)作为首字母的5个词组来定义和表述。这5个英语词组的首字母合在一起就是S.M.A.R.T。具体说来,智能以S (Services)作为服务导向,以M(Modularity)作为平台模块组合,以A (Agility)作为策略与目标的敏捷实施,R (Renovation)作为观念与模式创新,以T (Technology)作为先进技术的推广运用, 它们合在一起即为智能化(SMART)。简而言之,智能化社会侧重于现代智能化创新的这5个重要特性和运作方法:1)坚持服务社会的导向,2)善于模块化平台组合,3)精于目标的敏捷实施,4)敢于制定改革创新策略,5)专于发展世界先进技术。 智能社会在东西方社会中的定义不尽相同,但我们可以引以为鉴。例如,英国的智能社会目标是充分利用现代技术的潜能与动力,使国民有更大的生产力;把资源重点用于重要的经济活动和社会关系;最终改善全社会健康,幸福和生活质量。他们把智能社会定义为:一个成功地发挥信息技术潜力,高效运用联网设备和全球信息网络,以改善公众生活为目的的社会环境。他们提出的智能社会的5个要素是:数据化的信息文化;科技化的知识公民;网络化的执行机构;现代化的管理设施;和开放化的市场平台。(参见:“Towards a smart society”) 智能化创新是现代社会发展的必然途径。智能化 (SMART)创新文化促进了西方文明,已经在西方国家的企业组织与社会项目管理中广为实践,并大大提高了企业与组织的绩效。美国著名的管理学专家保罗•迈尔在《态度决定一切》中介绍了创新型企业设定智能化(SMART)创新目标的五项指标。这种可程序化的创新文化模型仅由五个简单、易懂、好学、实用的智能指标所构成,这五个智能化目标法则分别以首字母为S.M.A.R.T.五个英文单词组成。S(Specific)代表具体化,M(Measurable)代表可测性,A(Attainable)代表可行性,R(Relevant)代表相关性,T(Time-bound)代表定时性,分述如下: 具体化(Specific)要求创新目标是具体的,不是普通的,要清晰无误,不能含糊不清。要使团队的目标具体化,就要准确告诉他们所期望的是什么,为什么很重要,要涉及那些人,发生地点在哪里,以及重要特点是什么。设定这样的具体目标一般要回答5W的问题:是什么(What, 什么项目),为什么(Why, 目标是什么理由,完成目标的好处),在哪里 (Where, 发生在什么地点),是何人(Who, 谁将参与),有哪些(Which, 什么要求和限制)等。 可测性(Measurable)指标要求用具体标准来测量要实现创新目标的进度。如果一个目标是不可测量的,就不可能知道执行团队是否能成功地完成其进度。衡量进度能帮助团队不脱轨,并按时达到其预期的阶段目标,而团队也能及时体验完成任务和获得成就的喜悦,并受到激发,不断努力,达到最终目标。可测量的目标要回答这样的具体问题:1)价值多少?2)多少人参与?3)什么时间完成?4)所有指标是否可量化? 可行性(Attainable)指标强调创新目标是真实可行的。可行的目标会吸引团队去实现。目标不能空泛、渺茫,既要力所能及,又要有挑战性,不然便会失去意义。只有当你感到一个目标的意义重大,你才会想方设法去实现它。目标的可行性通常会回答如何做的问题:例如,1)目标如何实现?2)在各种限制条件下,目标的真实性如何? 相关性(Relevant)指标强调所选择的创新目标要至关重要。至关重要的目标将会带动团队,部门,和组织一起前进。一个目标只有对准组织的发展方向,支持组织的其他目标,才是密切相关的目标。很多时候,要实现一个目标,你需要组织内的多种支持:需要资源,需要有人站台,需要有人破除障碍。因此,你的目标必须与你的老板,你的团队,你的组织密切相关,因为你需要获得他们的支持。 定时性(Time-bound)指标强调该创新目标要在一定时限内落地,就是要限定完成目标的日程。承诺完成限期会帮助团队届时集中努力去完成目标。智能化(SMART)目标的这项指标是为了防止目标的拖时和误期,因为在组织机构中的每天都会有干扰和危机出现。有时限的目标就是为了建立一种完成任务的紧迫感。具体说来,有时限的目标通常会回答这些具体问题:1)什么时候完成?2)从现在起6个月后能做什么?3)从现在起6周后要做什么?4)今天我能做什么? 美国创新型企业通过建立创新目标的程序化和常态化,将之作为竞争利器,利用创新使自己与众不同。他们鼓励创新的做法有4点: 1)在各个业务部门定期开展培训,集思广益;2)在企业规划和战略部署中注意使用创新方法;3)以公司的核心竞争力为出发点,不断创新;4) 在产业并购中引用创新方法作为一个重要部分,依此发掘与分析并购目标的增长潜力。 结论: 正如科学思维为现代社会发展构建了强大的深层架构,智能化创新为智能社会发展编制了先进的路线图。随着智能化创新的持续发展,人工智能(AI),商业智能(BI),治理智能(GI),和运营智能(OI)等社会智能要素都可以在功能,量化和程序化方面得到不断拓展和提升。不久的将来,更多的像AI,BI,GI,OI,的专业智能模块将会如海潮般涌现,经过进一步的智能化(SMART)创新合成,量变势必引起质变,即可成就明日智能世界的智慧文化环境。在创新文化,智能文化,智慧语言和智能科技的交织作用下,以目前智能科技发展每18个月倍增一代的更新速度,到改革开放的下一个30年完成之际,智能科技将经过20代的翻番,届时,一个美好的明日智能社会将会更加璀璨夺目,屹立在世界的东方。

杨鸣:智能社会主义新思维(二):国家治理现代化需要公共、开放、智能化平台

中国30年改革时至今日,诱人的改革红利使中国的政治经济体制改革可谓人心所向,令人翘首以待。然而改革进入纵深境地,一步失误亦可导致全盘皆输,这令顶层改革的舵手和设计师们举棋不定,深感举步唯艰,已经不是简单地通过做蛋糕和分蛋糕之争就可以解决的问题。回想30年前的经济改革初期,许多改革方案从头开始。改革的关键是全民动员,任何简单有力的方法和行之有效的方针都可以令人激动,年年可制造GDP增长的神话。邓小平的“摸着石头过河,让一些人先富起来,谁不改革谁下台”等口号一言九鼎,无不令人欢欣鼓舞。然而时至今日,改革已进入攻坚期、深水区,诸多矛盾和问题错综复杂地交织叠加在一起。改革需要有科学,完备,和智能化的载体和平台,才能推动制度更加成熟、定型,为人民幸福安康、为社会和谐稳定、为国家长治久安提供更完备、更稳定、更管用的制度体系,才能在国家治理体系和治理能力现代化上形成总体效应、取得总体效果,才能有效破解经济社会转型升级的发展难题,以及成功应对现代化过程中的风险考验。现代化国家治理体系是复杂而庞大的体系,体系的周密运转必然需要有公共、开放、智能化的国家治理平台,通过各领域、各行业无缝对接的服务模式,形成一个囊括各种政府职能,实现改革开放目的,服务社会各个领域,并适合社会各阶层参与的科学治理环境。 建立公共、开放、智能化平台便于改革的实施。顶层设计至关重要,但先进的、现代化的执行方法和模式是发挥制度作用的关键环节,执行力度和效率是制度力量的具体体现。因此,提高科学的,智能化的有效治理国家的能力至关重要。如何推动经济转型升级、提质增效,怎样弥合利益分歧、纾解分化焦虑,如何促进社会公正,营造权利公平、机会公平、规则公平的环境,筑牢社会保障的底线?这些问题,既是顶层设计的命题,也同样是治理能力现代化无法回避的考题。国家治理体系的顶层设计和实施将会涉及数千个公式和参数,数百个功能机构与执行部门,多行业的智囊和咨询机构,从上到下,从中央到地方的通力协作,以及全国人民在各个层面的支持与参与。这样复杂的系统需要智能化,网络化,大数据化,和大信息化的技术架构。否则,就连统筹庞杂的地方治理机构都会顾此失彼,难怪会导致“政令难出中南海”的窘迫局面。 李克强总理指出,“改革是最大动力,也是最大红利。要始终坚持让人民群众在改革中受益。要建立更加公平有效的体制机制,注重利用增量带动理顺利益关系,让全体人民共享改革发展成果,”笔者认为这也是搭建国家综合治理平台的发展目标,即通过一个公共、开放、智能化的,从中央到地方的合作与服务平台,高效传递改革动力,为全国人民提供服务与获取红利,通过公民共同参与以及社会共享资源和成果,快速营建和谐发展的环境,形成一种发达社会的完整运作机制。 在技术层面,开放型智能平台通常应由多数据中心联合驱动,足以支持各种开放的应用程序,各行业和板块的专业系统,以及大规模的内容市场。平台上各种应用程序要经过严格的专家评估,广泛的用户测试和试用,性能稳定后通过云端和网络快速传递和推广到各运用领域及消费者。现代化发展的生态环境要求这样的综合智能平台应具有非常大的规模和非常高的流动性,适宜各行各业的新应用程序不断引入,而效率低下的旧程序则可快速退役。现代化发展的规模化运作要求平台服务内容也将以非常高的速度大量产生,并随着时间的推移根据市场和用户需求进行安全存储和迅速更新。智能化基础配套设施要求对敏捷性的资源分配,可扩展性,可靠性,问责制和安全性都有可靠保证。平台追求高效的成本效益,要求其基础设施是流动的、柔性的,各种应用工具乃至整个系统均可以容易地复制,重新利用,重新编程,以及添加新的功能。系统的智能化管理和控制应保证平台使用低能耗和低运营成本来提供高效的资源使用率和高度可用性。这种基于云计算的虚拟基础设施架构是开放结构的,开源的,允许各种子系统的联网,对接和整合,以便支持快速推出新应用程序以及提供配套资源的配置方案。 开放社会共享平台,通过合理的参数配置,可促使科学治理与中华文化根源的结合与交融。目前中国社会凸显中华传统伦理和精神的沙漠化。周晓虹近期在《美国华裔教授专家网》发表博文“中国社会心态危机蔓延”一文指出:“中国社会的消极心态是伴随着巨大的社会转型出现的,这是社会转型的伴生物。社会变迁速度的加快使得我们降低了对获得改善的满意度,同时提升了我们的期望值,眼光越来越高,不满却越来越深。”资源不能共享,改革红利不均衡,导致先富与共富之间演化为社会阶层矛盾的趋势。改革开放30多年中,人和人、群体和群体间的差异被拉大。刚富裕起来的人对获得的财富非常看重,只有显摆,不愿共享。她提出长线的危机处理方法:“我们的教育必须改变,否则,中国人会成为世界上最物欲、没有精神追求的人群。” 中国特色的社会主义核心价值,必须建立在孕育中国文化的优良传统意识形态上。这体现了中华文化的积淀和中华民族对国家发展最深沉的精神追求,代表着中华民族独特的精神标识,是中华民族生生不息、发展壮大的精神滋养,也是走向现代化、建设现代市场经济的精神资源。在中华民族传统文化中,凝聚着一个伟大民族几千年传承的集体记忆和集体呼唤,形成了独特的民族传统意识形态。因此,中国的政治与经济体制改革必须包含和发扬光大优秀而深沉的中华传统。这些中华文化基因和精神元素同样需要通过一个公共、开放、智能化的合作与服务平台得到彰显。因此,智能化国家治理平台可以作为智能社会主义对中华传统伦理和精神的传承。 通过智能社会管理来推进国家治理体系和治理能力现代化。根据《大国治理》所提炼的精华内容,中国特色的国家治理现代化,总体应包括民主化、法治化、科学化、制度化、规范化、程序化、高效化这七个基本的要求。这构成一个复杂而曲折的操作过程。拿大国治理体系来说,完善发展中国特色社会主义,所要展开的观点可以说是纵横交错、相互关联。至少包括经济、政治、文化、社会、生态、党建等各条战线的治理;包括民主、监督、法制、规范、文明、协商、科学、道德、社会主义核心价值等各个要素的建立和运用;包括从中央到地方到基层各个层级的治理等。最近在高层有一个新颖的、也是古人曾经提出的观念,将国家治理比喻为如烹小鲜,奢谈“烹鲜学”。这个提法的跨度太大了,也太笼统了,如果没有智能化超级国家治理平台,恐怕连原料都搞不清楚,何以治大国家如烹小鲜? 在21世纪,任何治理体系、治理能力都要实现现代化。现代社会是经济全球化、政治多元化、生活多样化、社会信息化的时代。我们的治理体系、治理能力要适应这四化的要求,才算是现代化。能够代表先进的生产力,代表先进文化,运用现代化手段,包括大数据背景下的新型互联网等,才能称得上现代化。在这里,社会信息化是关键,没有先进的技术架构,没有云计算,大数据,虚拟与流动的信息掌控,大型云数据中心的超级引擎,就不能建立治理大国的基础架构,不能真正实现社会信息化。 发展公共、开放、智能化平台,科学地推进市场改革。我国目前的市场体系存在几个突出问题:一是条块分割形成碎片化的市场格局;二是部分市场还没有对所有主体平等开放;三是由于部分行业的垄断导致竞争性缺失;四是市场尚未建立在公平透明规则的基础上;五是商品市场发展比较快,但要素市场,特别是资本市场非常落后。这些问题也是东、西方世界所共有的,是经济发展模式基于自由市场的通病,关键在于社会资源共享不畅,开放性社会协作失调,以及有效的管控与协调机制的缺失。改革是科学化的进程,需要优化的管理环境,以及灵活的危机排除机制。深化改革要从发展公共、开放、智能化市场与政务管理平台开始,使现有的法律法规和改革的目标在同一平台上相互参照,形成统一开放、竞争有序的社会与市场体系。 搭建开放、智能化市场平台,保持经济平稳运行。目前的中国社会舆论过多关注于经济增长的速度,具体表现在GDP的增长率。其实中国经济改革的关键不在于速度,而在于效率。只要效率提高对GDP的贡献在提升,经济增长平稳不是坏事。然而没有开放的智能化市场平台,保持平稳经济运行就难以持续。重政绩,拔苗助长,短期效应的,不讲科学的高速发展不可取;轰轰烈烈、杀鸡取卵,大跃进式的发展模式更可能造成适得其反的结果。因此我们在推进改革过程中要重技术,讲科学,按步就班,谨慎实施,要特别注重如何投入小成本而产生明显的效果。 习近平总书记最近指出,我们要“建立公开统一的国家科技管理平台,构建总体布局合理、功能定位清晰、具有中国特色的科技计划体系和管理制度,以此带动科技其他方面的改革向纵深推进,为实施创新驱动发展战略创立一个好的体制保障。通过统一的国家科技管理平台,建立决策、咨询、执行、评价、监管各环节职责清晰、协调衔接的新体系。”这虽然是对国家科技资源整合的顶层设计,但也标明新的国家改革的战略和思维:以现代科技创新与发展的动力来带动改革,建立开放的、综合的国家治理平台。保证在国家范围内构建布局合理、功能定位清晰的国家治理体系和管理制度。 21世纪的今天,智能化平台席卷全球教育,管理,商务及市场。随着工业革命的步伐加快,在日新月异的技术革命背景中,社会经济发展模式已从缓慢的生态进化激发到跳跃式的环境更新。纵观世界工业革命的发展路径,从19世纪争夺地盘,到20世纪抢占市场,再到今天21世纪共建平台,深度经济改革和国家治理现代化要把基于新一代技术创新:高速网络、云计算、大数据的智能平台作为国家综合治理的政策载体和运行机制。这将保证改革沿着安全航道向纵深高速发展。展望未来,一个基于共享、开放,智能化平台的智能社会主义轮廓如东方红日,呼之欲出,她将为西方文明所青睐,也为东方世界所瞩目。

杨鸣:正确解读大数据—大在智能,大在应用

一、大数据增添大智能 大数据(Big Data)概念和发展起于美国。最初由EMC集团(包括思科和威睿),甲骨文公司,和IBM倡议发展。大数据的定义方式因人而异,多种多样,但它通常描述数据的3 V(维)特性:1)巨大的信息量(Volumn),从TB(兆兆)级升到EB(千兆兆)级,又将跃升到Zettabytes (兆兆兆)级;  2)信息种类(Variety)繁多; 3)信息处理速度(Velocity)快,这指数据变为可用信息,并且可分析的速度。最近,大数据从3 V特性,逐步升格为4 V特性,即增加数据使用价值(Value),主要体现在数据的智能分析。 智能分析(Analytics)是一种对未来智慧的投资,分析的最终目标是做出更明智的决定。有些人误以为大数据只是数据技术处理的升级,即如何存储和备份所有的数据。但是,行家们谈论大数据,通常意味着用新的方式对数据进行分析并作出合理的解释。大数据的应用将有助于决策人灵活应对现实世界中“数据海啸”所引起的机遇和挑战。   大数据可以引起大动作,可以优化机构的决策和模式。2012年在美国企业和事业单位的技术总管所进行的有关大数据的调查表明了大数据对他们的单位起到了很重要的作用。76%的受访人认为大数据使机构的决策质量和速度大大改善。68%认为有利于机构作出更好的业务规划和预测;67%认为有利于提高机构内部运营效率;65%认为有利于改善外接客户与服务;65%认可减低运营或财务支出;67%认为有利于增加局势预测能力;60%认为有利于量化分析危机;56%认为有利于数据中心的实时操控和问题自动排解;等等。 二、大数据拓展大信息 大数据所涉及的信息与人密切相关。有关人的信息(人类信息)占世上现有所有数据90%,其中包括电子邮件,视频,社交网络,博客,呼叫中心的对话,以及更多种类。它以惊人的速度在增长:年复合增长率(CAGR)达62%。这种未来的信息计算,代表了一个根本转移人与物(物联网)和企业进行信息交互的方式。 “人类信息”将引起信息技术(IT)的再次进化。多年来,科技界一直在改变着信息技术(IT )中的技术(T)含量 – 例如通过引进大型计算机,客户端服务器,网络供应(IP),云计算,以及更多的技术重点。这当然改变了我们的信息技术落后局势,但并没有改变计算机与丰富的人类信息的互动方式。 人类信息的技术理解需要根本上的新方法和技术,为人类应对每天产生的和不断增殖的信息,提供洞察力,想法,和直觉。在有史以来的科技产业中,第一次信息 (I)在IT或 IS(信息科学)中正在发生变化,向着增加智能“I”(Intelligence)的方向发展。“信息科学”应该解读为科学信息,因为未来的信息计算,将以大数据模式,着重信息的智能化,引起人类社会信息交互方式的根本性转变。以智能分析为前提的信息应用将会以更大规模解读人类,解开人类信息的价值。 在美国2012年8月对1105家信息企业和集团进行的一项调查显示,在200名受访者中,几乎63%的人同意,除非他们实施和使用大数据,他们将更难以满足他们机构的使命。即使是在经济艰难的时期,49%的受访者预计他们要增加大数据预算,而另外46%的受访者计划要维持他们的大数据预算。 迅速发展的全球大数据市场(图表来自美国IDC 研究所) 三、大数据触及大社会 人类信息大多是非结构化数据,占所有信息的90%,非结构化信息正在以62%的年复合增长率发展,除了其庞大的规模,非结构化的信息的社会应用越来越多。当处理信息搜寻或揭露犯罪时,研究人员从犯罪人的电子邮件中寻找证据。当试图理解他们的客户群时,营销者开始寻找他们的客户的信息。但是客户不把信息发送给您的数据库,它们有自己的推特或博客。这使我们看到当今信息爆炸的社会媒体活动变得越来越复杂。 网络视频是一个运用大数据的生动的例子。创建和使用网络视频信息的人也越来越多。例如,君视屏(YouTube)成立于2005年初,该网站使用和消耗数据的速率在迅速增长:用户每分钟上传约35小时的视频;建网仅一年,YouTube上的视频就被浏览约200亿次;在过去的四年里,视频上传量已经增长了8倍;估计到2020年将超过35 Zettabytes。 视频信息在YouTube上的使用增长不是一个孤立的情况,苹果公司的iTunes和脸谱网(Facebook)已经越来越多地使用有关音乐和照片信息。这些组织根据消费者的需要,增加他们的在线状态,并试图利用消费者公布的数据。 YouTube和社交互联网进一步显示人类信息在今天的文化中的扩散。 数据集的增长如此之大,使现有的数据库和管理工具难以应付。困难包括采集,存储,检索,共享,分析和可视化。这种趋势还将继续下去,因为大数据集的分析有助于发现业务发展趋势,预防疾病,打击犯罪工作的好处,应用越来越广。大的数据集出现在多个学科,更多的、不断增长的大小数据集层出不穷,因为它们更频繁地聚集。 用传统的方法尝试处理如此庞大的数据集,需要数十,数百甚至数千台服务器上大规模运行软件和并行操作。此外,大数据的大小应用完全依赖于该组织的需求和能力。如果一个组织已经建立了一个可扩展的方式来管理数据,数百TB(兆兆)的容量不是一个问题。对于其他人,甚至几百MB(兆)字节,可能就需要一个全新的数据管理策略。 四、大数据共享大资源 信息技术通过云服务实现资源共享,包括共享昂贵的基础设施,无论这些基础设施是信息储存,硬件技术,或专业人才。由于云资源可以共享,并独立于时间和地点,导致社会实体之间越来越共享资源,即信息的供需,数据的储用,以及软件的集中与规模化。例如,图书电子版本可用于多用户,甚至同步使用。高校无须拥有与购置同一书籍的原始版本,可以选择由哪个机构进行那些卷策的数字化处理和由哪个机构存储原始的印刷版。这种合作可以降低成本(例如,数字化,存储)和拓展资源的利用。 例如,哥伦比亚大学和康奈尔大学的图书馆有一个合作项目,名为2CUL(绰号,发音为“Too Cool” (太酷),由图书馆的首字母缩写而成),对图书馆的藏书进行数字化和共享。尽管2CUL更广泛的倡议包括许多领域的共享库存服务,如收藏集开发,编目,和工作人员的专业知识,而项目的重点是发展的技术基础设施,使合作伙伴能提高图书和数字文件传递和电子资源管理,以及提供共享的电子材料的长期归档。哥伦比亚和康奈尔相信这个共享服务将改变图书馆系统为他们的选区所提供的内容和服务,认识到他们一起将比他们单独所能够实现的更多. 海西图书资料集团(HathiTrust)为共享基础设施提供了另一个例证。海西图书资料集团是个大型数字资料仓库,归六十多个美国的和一个欧洲的研究图书馆集体所有。HathiTrust的运作模式包括数字化材料的共同治理和财务,收集,保存和借用。此外,研究人员通过HathiTrust的研制发明和计算工具,能够搜索和分析数字化内容,包括书籍和期刊以外的数字化文件格式。截至2011年底,该集团的电子书库包含近1000万册的电子书卷,其中27%属于公共领域的图书。 其他类型的基础设施,如网络,处理能力和数据存储,也可以共享。例如,兆兆网格(TeraGrid)是一个进行网格计算的基础设施(高性能计算资源,数据库,工具及实验设施),总共汇总了十一所院校的资源。当然,教学工具也可以共享。例如,iLabs是可以通过互联网访问的在线实验室的集合,让学生在任何地方和任何时间均可进行实验室试验。开放课件汇集也可以被认为是一个共享的基础设施。例如,塞勒基金会的Saylor.org,是一个可供开放访问的在线学习平台,免费向公众提供可自控的大专层次的课件。

杨鸣:大数据从哪里来,到哪里去?

大数据(Big Data)概念和发展源起于美国,最初由EMC集团(包括思科和威睿)、甲骨文公司和IBM倡议发展。全球信息咨询机构国际数据公司(IDC)对大数据的技术定义是:通过高速捕捉、发现或分析,从大容量数据中获取价值的一种新的技术架构。大数据具有4V特点:Volume(体量)、Velocity(速度)、Variety(多样性)、Value(价值)。 有些人误以为大数据只是数据技术处理的升级,即如何存储和备份所有的数据,但是,行家们谈论大数据,通常意味着用新的方式对数据进行分析并做出合理的解释。大数据的应用将有助于决策人灵活应对现实世界中“数据海啸”所引起的机遇和挑战。“大数据”可以引起“大动作”,如优化机构的决策和模式。2012年在美国企业和事业单位的技术总管所进行的有关大数据的调查就表明了,大数据具有重要作用——76%的受访人认为大数据使机构的决策质量和速度大大改善;68%认为有利于机构作出更好的业务规划和预测;67%认为有利于提高机构内部运营效率;65%认为有利于改善外接客户与服务;65%认可减低运营或财务支出;67%认为有利于增加局势预测能力;60%认为有利于量化分析危机;56%认为有利于数据中心的实时操控和问题自动排解等等。 实际上,在移动互联网飞速发展的今天,各类个人生活、企业经营和政府管理等方面的数据都在不断以几何方式递增,大数据正在不断激发巨大的力量。正如IBM首席执行官罗睿兰曾说过,“数据将是下一个大的自然资源,它将区分每个行业的胜者与输家。”国内的先行者如阿里巴巴已经尝试通过数据和C2B的结合,利用电子商务平台引导和激发消费力,引领消费模式的变革。业内人士也相信,阿里今年对于新浪的收购也是其利用大数据布局未来(移动)互联网江湖的重要一环。其他领域当然也不例外。“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。”正如哈佛大学社会学教授加里•金所言。 这么说,似乎已经解答了大数据“从哪里来、到哪里去”的问题,但实际不然。大数据大热的同时,更要求我们洞察现实,避免其演变成为一场概念炒作或者是划地圈钱的运动。我们应该清楚的是:大数据本身并没有什么意义,如何从不断激增的数据中去除垃圾、寻找价值进而采取行动的过程才是其真正价值所在。 多年来,科技界一直在改变着信息技术(IT)中的技术(T)含量,例如通过引进大型计算机、客户端服务器、网络供应(IP)、云计算等技术重点。这在一定程度上改变了我们信息技术落后的局势,但遗憾的是,这些技术却并没有成功变革计算机与丰富的人类信息的互动方式。人类信息的技术理解需要根本上的新方法,为人类应对越来越巨大的信息量提供洞察力、想法和直觉。实际上,我们可以看到,在有史以来的科技产业中,一次信息(I)在信息技术(IT)或信息科学(IS)中正发生正变化,向着增加智能“I”(Intelligence)的方向发展。“信息科学”也许可以解读为科学信息,因为未来的信息计算,将以大数据模式呈现,更注重信息的智能化,并足以引起人类社会信息交互方式的根本性转变。 以智能分析为前提的信息应用将会以更大规模解读人类,解开人类信息的价值。比如谷歌公司采用的是Big Query(大查询)大数据网络服务模式,用来操作大规模数据集的互动分析,可以查询高达数十亿行的网络数据。Big Query既方便扩展又易于使用,可满足强大的数据分析需求。Big Query中最大优点是可以对非常大的数据集进行互动分析,例如,欧中帕克斯公司经营了一个全球度假胜地网络,他们想找到最管用的营销技巧,以便在繁忙的假期到来之前就可以摸准和查获所有的潜在客人。他们利用Big Query建立新的网络应用程序,“仅需点击按键,即可确定特定数据,将某特定国家或特定时间区域的客人预订信息的查询结果全部调出来”,然后再将这些查询结果插入谷歌的可视化API系统,形成分析图表。 处理这样巨大的任务,谷歌的Big Query在几秒钟的嚓嚓声中,就梳理了数百万条的数据记录。相比之下,若选用任何其他系统,同样的数据查询都可能至少需要8分钟之久。这个网络查询系统使欧中帕克斯能够及时访问所需信息,然后设定价格,最后帮助他们最大限度地提高收入。据统计,他们的数据运营成本每年可节约15万欧元,最重要的是,由于采用云端应用程序,他们并不需要在本部计算中心运行系统软件与数据,设备费用又可节约近80万欧元。 在定义大数据时,一些专家喜欢展望未来:更高超的技术,更快的处理速度,更有效的处理方式,他们通常以Hadoop分布算法,Map Reduce数据集成算法,和云计算为例。但实际上,大数据的处理与整合是一个非常复杂的过程,其中更离不开一个非常特殊的环节-人类的大脑。目前,通过广泛网络参与方式,把成千上万个大脑的智慧叠加、合成来获取解决方案的方式备受青睐,在这里,杰夫•豪于2006年提出的“众包”概念(Crowd Sourcing)得到了很好的诠释。 Kaggle利用“众包”,打造了崭新的大数据社会智力参与模式,Kaggle搭建数据众包平台,让统计专家和科学家们走上前台,竞相告诉企业如何解读和应用数据。Kaggle通过网络应征和科研攻关的挑战模式,建立起经验丰富的客户解决方案团队,帮助客户在备份数据中识别问题,寻找企业所需要的价值模式。此外,Kaggle从多流数据采集到数据整合,采用便于定制的解决方案,在貌似杂乱的数据丛林中,为企业找出可用的信息,并提供360度的视角为客户分析数据。类似的众包平台不止一个,Crowd Analytix和TunedIT也是佼佼者。 业内普遍认为,2013年将成为大数据的元年,但如何处理和分析庞大的数据正考验着科学家和企业家。总之,没有智能分析的数据,或只分析却不采取行动,或有行动却没有积极方面的影响,都不会被人为具有任何价值。因此,当你听到周围谁在炒作大数据时,请记住数据本身并没有任何价值,关键在于你用它做了什么或者它刺激你做了什么,最后产生了怎么样的影响。

杨鸣:大数据可改变企业发展游戏规则—技术处理及模式分析

由于人类数据存储量的不断上升,而各种汲取有意义数据模型的技术成本则持续下降,越来越多的企业可受益于大数据的推动。目前的大数据技术 ,如阿帕奇公司的Hadoop大数据平台,较早进军大数据领域,作为一个新兴产业,取得了初步的成功。大数据有望在近期带动企业开辟各种大型网络业务活动和云端服务,协助企业占据改变游戏规则的竞争优势 大数据要改变企业发展游戏规则,首先要能随意扩大缩放规模。LinkedIn采用在线分析处理(OLAP)类的解决方案,为在世界各地的1亿7千5百多万网络成员提供服务。由于会员们都在浏览器前等待页面加载,它必须能够在几十毫秒内解答用户疑问。LinkedIn用户的数据查询的跨度相对减少 – 通常是几十,最多上百项 ,所以该数据可以在一个标度上共享。数据关联可局限到查询者本人,不允许分析超出会员本人界外的数据内容。 为了保证缩放规模,LinkedIn采用双引擎驱动数据查询:1)、可批量计算多维数据集的线下引擎,2)、用户实时查询服务的在线引擎。下线引擎利用Hadoop的分批处理方法,计算具有高吞吐量的数据块。然后写入多维数据集的Voldemort(伏地魔)分布式数据库,与伏地魔存储中的LinkedIn的开源键入值(key-value)合成有关数据集。在用户加载网页时,通过在线引擎查询伏地魔存储器。这个架构中的每一数据块均在用户可交易硬件上运行,可以很容易地水平扩展。 1、公共服务:Hadoop分/缩式数据处理框架 大数据的社会共享能力将成为业务发展的动力。以经营弹性云服务的亚马逊商务云为例,Hadoop为亚马逊弹性云搭建了基于分/缩算法(MapReduce)强大的数据处理框架,使之成为可集中管理、便于扩展、和易于使用的公共智能数据分析平台。亚马逊利用Hadoop中的MapReduce分批查询机制,形成一系列具有广泛生态系统的的工具,可将数据分析同时部署到一个高档次、安全的公关基础设施服务平台。 亚马逊网络服务为用户提供按需接入技术,提高成本效益的大数据处理技术,帮助用户收集,存储,计算和协作来自各地的各种规模的数据集,除了具有先进的Hadoop的管理服务和弹性分/缩(MapReduce)机制,亚马逊数据中心的计算硬件使用强大的英特尔®至强®处理器E5系列,为用户定制高效的,可扩展的大数据分析。 亚马逊云端公共服务平台,可帮助行业创建基于弹性云(EC2)的云端技术服务与资源供给系统,为公司用户提供或开发具有国际先进技术水平的云技术商务应用平台。服务内容可包括各种云端技术服务、操作系统,资源配置、数据信息服务、及配套业务应用软件。平台操作简便,用户仅需选择一个预先配置的最佳操纵模式,通过配套服务和工具即可启动和运行公司所需的云端业务。这使公司可以轻松进行基于云数据中心的、功能强大的商业计算和数据处理,把自定义的应用程序和业务环境加载到数据中心服务系统上。 2、核力引擎:BigQuery(大查询)网络数据处理 谷歌公司采用的是BigQuery(大查询) 大数据网络服务模式,用来操作大规模数据集的互动分析,可以查询高达数十亿行的网络数据。BigQuery既方便扩展又易于使用,可满足强大的数据分析需求。 BigQuery中最大优点是可以对非常大的数据集进行互动分析,例如,欧中帕克斯(Center Parcs Europe)公司经营一个全球度假胜地网络,他们想找到最管用的营销技巧,在繁忙的假期到来之前可以摸准和查获所有的潜在客人。他们利用BigQuery建立新的网络应用程序,“仅需点击按键,即可确定特定数据,将某特定国家或特定时间区域的客人预订信息的查询结果调出来”,然后再将这些查询结果插入谷歌的可视化API系统,形成图表和图形。 处理这样巨大的任务,谷歌的BigQuery在几秒钟的嚓嚓声中,就梳理了数百万条​​的数据记录。相比之下,若选用任何其他系统,同样的数据查询都可能至少需要8分钟之久。这个网络查询系统使欧中帕克斯能够及时“访问预订信息,设定价格,并最大限度地提高收入。”他们的数据运营成本每年可节约15万欧元,最重要的是,由于采用云端应用程序,他们并不需要在本部计算中心运行系统软件与数据,设备费用又可节约近80万欧元。 3、个性数据:图索法(Graph Search)数据处理 脸谱网(Facebook)的发展更离不开大数据。 Facebook的用户群数目已成为天文数字,现有用户超过10亿,其中7.43亿是活动用户。脸谱网面临数据轰击的速度,种类和数量是如此之巨大,不是只靠数据中心就可以对付。脸谱网成功的一个主要的原因是创建了图索法(Graph Search)数据处理模式,其影响力之大可最终盖过搜索巨头谷歌。因为谷歌数据只是通过公开网上搜索,相同选项大多数人都会得到相同的结果。然而在Facebook上,同样的搜索,比如“苹果”,不同用户会得到完全不同的结果,因为Facebook的图索法能够做到深度的个性化。 图索法不仅让用户可以搜寻Facebook网的数据,还可以在搜索结果上包含一种社交信息层面。用户能够在搜索到的Facebook的个人主页上,发现更为密切的,令他们更感兴趣的链接。例如,通过图索法,用户可能会查找到住在旧金山有那些朋友,这些朋友中有谁喜欢冲浪,还能随意调出朋友们的照片,了解朋友们的喜好,等等。在Facebook上用户可查找与朋友相互可分享的任何东西,由于公开分享的内容可以根据用户的愿望设置,所以即使查找同样内容,不同的人看到的却是不同的结果。 4、开放结构:NoSQL(非关联检索)数据库 在现实世界中,要做决定,你会喜欢有多个取自不同来源和角度的见解。大数据的魅力正是如此,可跨越任何信息源和性质不同的数据,为要作决定的用户提供所需的见解。例如经营网络社交游戏的Zynga公司,在收购OMGPOP网之后,其网络移动游戏增长一度居行业之首。有数以百万计的用户端同时上OMGPOP网玩“农家乐”(Farmville),还有6个星期内就扩大到3600万用户的“想画就画”(Draw Something)程式,因此Zynga需要有一种即简单,又快速,又有弹性的数据库。为此他们开发出了特别为大数据时代设计的新一类产品,称为NoSQL(非关联检索)数据库。来满足千万用户使用和共时处理和传递实时数据。NoSQL游戏“清脆的” 实时数据响应意味着更好的整体用户体验,实时数据也使用户更愿选择,或花更多的时间来玩您的游戏或应用程序。不难想像,实时数据甚至还会在商业竞争中帮你取胜。 NoSQL数据库为数据存储和检索提供了简单的,轻量的机制,比传统的关联型数据库提供了更高的可扩展性和可用性。 NoSQL数据存储使用较宽松的同构数据模型来实现横向拓展及更高的可用性,其数据存储一般不采用SQL表格式方法存储数据。NoSQL通过高度优化的检索和附加操作,加快数据记录存储,增加互动速度。与完整的SQL系统相比,虽然运行数据的灵活度有所减少,但数据模型的可扩展性和互动性能却有显著提高。 5、社会智能:大数据众包(CrowdSourcing)模式 在定义大数据时,多数专家认为大数据需要用更高超的技术,减少可容忍的处理时间,更有效地处理大量数据,他们通常以Hadoop分布算法,MapReduce数据集成算法,和云计算为例。其实大数据的处理与整合更离不开一个非常特殊的技术-人类的大脑,并通过广泛网络参与方式,把成千上万个大脑的智慧叠加,合成,并“众包”(CrowdSourcing)给用户。杰夫·豪于2006年在一篇网文中创造了CrowdSourcing这个术语,他在文章中描述了如何利用众包模式充分发挥个人智力的社会参与能力。他认为众包是大数据所需要的“特殊技术”(模式),他以加州大学伯克利分校SETI@Home项目为例:SETI@Home以分布式计算方式,挖掘数以百万计的家庭个人电脑的待用处理功率,通过互联网连人带机打包形成备用的待机工作网络,其最大卖点是利用数以百万计的个人电脑和人脑的处理能力。 “众包”模式以崭新的大数据社会智力参与模式,很快为企业用户所青睐。例如,Kaggle(可雇)数据众包平台让统计数据专家和科学家们走上前台,竞相告诉企业如何解读和应用数据。Kaggle通过网络应征和科研攻关的挑战模式,建立起经验丰富的客户解决方案团队,帮助客户在备份数据中识别问题,寻找企业所需要的价值模式。此外,Kaggle从多流数据采集到数据整合,采用便于定制的解决方案,在貌似杂乱的数据丛林中,为企业找出可用的信息,并提供360度的视角为客户分析数据。 Kaggle认为任何公司都会需要它的数据分析众包模式,通过数据分析,让事实说话。相比传统的咨询公司,数据分析家霍华德说,过去的咨询公司在相当程度上有“蛇油推销员”的特征,往往在漂亮的图片和文字背后缺乏科学的根据。”他说,Kaggle的众包竞争模式反而“是世界上迄今为止用来搭建和培育[预测]数据分析模型的最好方法。客户通过这种基于“智能分析价值链”的数据分析模式,找出数据应用的最好方法。由于数据分析的每一步都不能出错,客户才能开发出数据的真正价值,所以 Kaggle的数据统计专家们也可一揽到底,在每一步都能为客户提供帮助。 6、智能分析:大数据启动云端智能服务 笔者最终还是要强调智能分析在大数据中的重要作用,无论是如何的不厌其烦。在云计算时代,大数据可启动各种云端智能服务。例如, 杨鸣博士设计的“都市物流与交通大数据管理平台,” 是一个用来设计与管理城市密集区域内智能交通与物流云服务系统。系统利用云计算大数据服务,传感技术、云端智能信息技术以及通过各类监控设备、视频、以及实时数据的处理和分析,整合基于云端大数据分析的智能交通管理和物流分配与引领、打造城市智能交通与物流综合信息平台。通过实施大规模智能化数据采集、分析和分流发布,为市区交通和物流用户提供实时交互路况、供货以车辆调度信息,提高市区交通及物流运行效率。 该方案通过云端技术的智能整合,提高现代信息服务的使用效率:使数据中心整体计算服务容量提高3倍;硬件购置成本降低 50%;以 10:1 的比率减少设备运维成本。通过虚拟机制流动资源管理、系统自动监控、自动服务器密度配置、和按需量化计算服务, 我们可帮助客户节省50-60%的运营成本,成倍提高业务能力,并可随时满足和扩大他们的业务发展需求。这使公司用户在大幅度地削减技术投资成本的同时,确保高度的业务灵活性,能对不断变化的市场环境,作出快速反应和决策。 人脑智慧在梳理大数据方面依然起到最终的决定作用。例如2012年美国总统大选,两党双方均不惜代价,利用大数据来预测大选中选民的趋势。当时罗姆尼共和党坚信形势对自己有利,蓄势待发。奥巴马民主党也分秒不停,想摸准选民的风向,主导选情。数周内他们对选情数据进行的细粒度采集和多位形势分析,作为制定竞选策略和掌握获胜机遇的机制。 笔者在这次竞选分析参与活动中深有体会。在数据分析上笔者利用权威数据源,根据选情与数据不对称表现,通过多维数据变量的综合分析,对影响选情的观念范式转移度进行界定,最终推导选情分析。早在2012年一月大选初期,笔者在华裔教授专家网发表的博文“2012中美互动,文明的冲突,争执应有道”中曾断言欧巴马必胜,共和党对手必败。 在2012年10月欧巴马与罗姆尼第一次公开辩论后,罗姆尼选情被大幅看好,综合民调支持率曾在数周内高出欧巴马。笔者根据历史和现实选情变化和实时竞选数据,分析首次辩论对大选的影响,又在博文中指出这是为时尚早的民意波动,欧巴马的竞选主导地位依然坚挺。 距总统大选日只有4天,选战依然难解难分。笔者根据当时9个摇摆州的摇摆情况,推断当时的选情局势基本决定大选结果。笔者当日发博文“杨鸣:美国2012总统大选,谁主沉浮?”认定选情对奥巴马民主党越来越有利,而共和党阵地渐失,很难再会翻盘,罗姆尼在9个摇摆州中恐怕拿不下2个。断定“除非出现如台湾大选那种总统候选人遭枪击突发事件出现,奥巴马必胜,不会再有意外选情发生。”后来发现,奥巴马阵营采用大数据辅助竞选,使民主党得以把握奥巴马总统大选的胜算。

大数据也有“成长的烦恼” 三大基础性“缺陷”待弥补

来源:中国科技网-科技日报,  王晓洁 郭宇靖 提要:大数据在深刻地改变着经济社会生活的方方面面。在立法短时间难以完成的情况下,应加紧制定有关大数据的标准、规则、指引,引导行业规范发展,加强隐私保护,促进政府数据开放。         大数据在深刻地改变着经济社会生活的方方面面。在立法短时间难以完成的情况下,应加紧制定有关大数据的标准、规则、指引,引导行业规范发展,加强隐私保护,促进政府数据开放。   ■打破砂锅 大数据在深刻地改变着经济社会生活的方方面面。然而,这一互联网新技术,眼下却遭遇数据难以共享等诸多困难。请关注—— 盘点当下的高热词,“大数据”是其中之一。然而,大数据却遭遇数据难以共享等诸多困难,数据的公信度和权威性因此打折。同时,大数据在应用、交易、法律环境等方面也面临着不少制度性难题。   “高热”之下有“冰点” 业内专家担忧,大数据“高热”下掩盖着“冰点”,这些“冰点”将阻碍刚刚起步的我国大数据产业的健康成长。 阿里巴巴集团副总裁、数据委员会会长车品觉认为,目前,大数据行业最突出的问题是“只见树木,不见森林”。移动互联网、电商等是“重用”大数据的重点领域,而大部分传统企业对此却缺乏意识,甚至还不清楚如何利用数据。 同时,大数据应用的深度也远远不够。“国内的不少企业仅是利用大数据模型做营销方案,而像谷歌、亚马逊等国际知名企业,已将大数据思维全面融入公司管理。”车品觉说。 找不到数据是数据应用企业面临的普遍困扰。海尔家电产业集团营销总经理宋照伟直言,海尔希望获知用户的多维度行为习惯,但能够掌握的信息渠道仍然狭窄,信息量不够理想。 “拿走数据的多,贡献数据的少。”贵阳大数据交易所执行总裁王叁寿表示,不少企业以保护商业机密或节省数据整理成本等为理由,不愿意交易自身数据,直接导致交易所的数据量不够丰富。 以阿里巴巴旗下的“芝麻信用”为例,其评分依据的数据只来自支付宝平台,本身公信力有限,而其他企业希望能利用支付宝相关数据时,又很难获得。 同样,政府数据公开程度也非常有限。比如,银行在为客户办理信贷业务时,只能查到其在当地的工商信息,无法获知其在外地的情况。 对于个人数据隐私保护、数据权属、政府数据公开等问题,目前尚无明确的规定,因此,纠纷时有发生。 以朱烨诉百度侵权案为例,2015年,网民朱烨发现自己用百度搜索关键词后会收到相关广告推送,因此将百度以侵犯隐私权为由告上法庭。法院一审认定百度侵犯朱烨隐私权,但二审却撤销一审判决。中国政法大学传播法中心研究员朱巍表示,两级法院给出截然相反的判决,说明法律界对此类新情况认识不一致。   三大基础性“缺陷”待弥补 专家从三个方面分析了产生上述问题的原因,并认为这是我国大数据产业发展必须加快弥补的三大基础性“缺陷”:产业信息化尚未完成;“大数据思维”未成行业共识;监管和立法滞后。 IBM大中华区大数据与分析部数据分析产品线主管洪建勋研究发现,目前国内大量客户还停留在将80%的时间用在数据获取上,还缺乏系统化整理,更谈不上“商务智能”应用了。这和企业信息化水平较低有直接关系。 洪建勋介绍,兴于上世纪末发达国家的“商务智能”管理,即“用数据说话”,这种管理方式的普及大大提升了信息化意识和水平。 中国社会科学院信息化研究中心秘书长姜奇平表示,信息化是大数据的基础,而信息化的推进都是先从消费者开始,然后才传导到企业和政府。农业、工业、能源等行业的数据化还需假以时日。 车品觉表示,现在企业大多将大数据作为工具,导致“要数据的不知道大数据从哪里来,做数据的不知道大数据如何用,用数据的人担心真实性不敢用”。 也正是因为“大数据思维”未能达成共识,数据互惠共利的环境难以形成,推动数据共享就比较艰难。 大数据产业发展之快难以想象,但对于数据权属、个人数据隐私、政府数据公开等,目前都缺乏具有针对性的法律法规。而且,大数据作为新型资源,目前还没有明确专门的监管部门。 “企业和政府收集的数据拿来交易,这个数据究竟是谁的?比如政府收集了企业的数据,那么这些数据是企业的还是政府的?国家鼓励数据交易,但在法律方面要进一步明确,让行业发展有法律依据。”王叁寿说。 朱巍介绍,现在对个人数据的保护,大多依照2012年通过的“关于加强网络信息保护的决定”,这已远远不能适应目前行业的发展现状。   加快发展探索成长之路 业内人士认为,我国大数据产业在目前乃至较长一段时间或都处于“成长烦恼期”,这也是大数据产业从稚嫩走向成熟的必经阶段。因此,要在加快发展中探索成长之路。 从规模上看,2015年我国大数据市场仅有102亿元,不及一家股份制银行一年的净利润。而在国内以及境外的资本市场上,还没有出现中国的大数据行业巨头。 关于大数据应用问题,清华大学数据科学研究院执行副院长韩亦舜表示,大数据产业仍在起步阶段,随着社会信息化程度加深,数据源也将更加丰富,大数据应用范围将不断扩大。 “随着经济转型升级,势必有越来越多的企业将借助大数据实现增长。”IBM大中华区大数据与分析部大数据与分析业务技术总监刘胜利表示。 对于大数据共享的困境,业内专家指出,这在全球都是一个难题。目前,我国正探索建立大数据交易所,以交易驱动数据共享;有的行业内部已经形成企业间互换数据的惯例,如我国参与的国际间卫星数据交换交易、移动互联网公司间的数据互换等。春节期间,微信支付、支付宝、百度钱包等联手诸多商家推出促销活动,本质上也是一种数据互换、互惠共利。 另外,可以借鉴国外经验,对政府数据进行更好的挖掘、利用,如将非涉密的政府数据放在网上,供社会查阅。 在大数据立法与监管层面,业内人士建议,应确定监管部门,完善相关立法。在立法短时间难以完成的情况下,应加紧制定有关大数据的标准、规则、指引,引导行业规范发展,加强隐私保护,促进政府数据开放。(据新华社电)

Skip to toolbar