深蓝海域KMPRO

姜伟主任做《电子政务中的数据挖掘应用案例》微分享

2017-01-17 15:55

姜伟主任做《电子政务中的数据挖掘应用案例》微分享
 
        姜伟,北京外事办信息中心主任,在2014年中国知识管理论坛分享了政务中的诗句挖掘应用案例。
       我们在2010年其实做了外事信息化顶层设计,信息化顶层设计为什么要这么做,大家在政府里头可能知道,你干一件事要钱,你这个钱也要有依据,所以我们当时 要做整体的规划,首先拿一个顶层设计,我要钱的话,找哪些依据,包括北京市的规划,外事工作的规划等等一系列的,包括北京市提到的智慧北京,这个智慧北京 这个概念跟知识有一点类似的地方。我们在这里头,我们最后提出来外事信息化的顶层设计,是我主笔的,大概起草了两年的时间。这里提到两个概念,在智慧外 事,是一个目标,我们实施一个过程,最主要的当时提出来的搭建外交外事网络智库平台,外交外事智库是是核心的关健词。2010年怎么做这件事,顶层设计, 刚才听了几位专家谈,搞知识管理,顶层设计从上到下,从下到上,我们外事办从上到下也有,从下到上也有。一个梳理我们整个自己的业务,梳理北京市的61 家,摸清家底,家底有哪些知识,有哪些信息资源,不先说知识,信息资源有哪些业务,产生哪些表单,提供什么服务,摸清这个家底,花了很长时间梳理这些工 作。
       其次在做这个过程中,涉及到一个文档一体化,跟市政府办公室、人大的信息资源管理学院、国家档案局、北京市档案局调研的成果。同时把我们的上级部门外交新 闻司、外管司、领事司、安全司、干部司,还有科研院所,外交学院、国际问题研究所、国际关系学院,还有市侨办、粗毛会进行外事知识管理调研。同时我们对驻 外的网站,155个外交部驻外网站、210个商务部驻外网站进行数据采集和分析,我们做了深入的研究。包括我们对国外的这些友好城市他们的网站上的内容进 行分析、调研,这个业务梳理、系统调研,可以说我们在做这个顶层设计,或者做知识管理智慧外事,最后落到我们的外事智库里面一个依据。后面结合案例,我们怎么去讲 一步一步从一个大的宏观逐步到一个点开始进行突破。所以当时做了这么一个总体的框架,从基础设施、信息资源、综合应用、综合展现,这一张图表面信息化工 程,这里面加入了很多的内容。在高校归决策这一个地方,精细管理、统筹集约,这三个做知识管理不同的层次,先统筹、集约考虑知识管理怎么做,从京 戏管理角度怎么做,最后从辅助决策怎么做,从这三个思考知识管理的问题。
       这是我们应用的体系的设计,这个一行以组织架构来进行梳理,这一行整个的业务,礼宾事务、国际交流,他们之间是一个什么关系。刚才说了业务,还得数据库支撑 它,这是礼宾业务相应的哪些信息。这是我们实施路径,2010年做了顶层设计之后,我们做了相当于五六个项目,那边是发改委、科委、财政局申请,这些加起 来有六千万,这里头每个项目里头夹杂一些知识管理的研究内容,在这边比如说电子文件的扩展数据,电子扩展原数据做了扩展原数据的思考,包括基于知识管理的外交外事的翻译系统,我们做得外交外事翻译系统做了典型管理的应用。为什么说特别典型,它囊括了大数据、云计算统计翻译的原理,效果非常好。包括电子文件 的数据挖掘的岗位和流程研究,以及原数据的模型的数据,电子文件可视化的文件,最后在这个案例给大家看,如果隐性知识如何显现。包括国际大型活动注册知识 管理,我觉得非常成功的,大家觉得搞APEC蓝,APEC注册系统是我搞的,APEC注册系统我是负责人,我负责的会议不是一场会,是17场,这一场会, 第三次高官会,大概一百多场会,我们整个服务了一年的时间。
       在这一年的时间里头囊括了厦门、武汉、青岛、宁波、北京,这个不同的地方,不同的部委有十个部委,外交部、文化部、全国妇联,一年的里头积累所有的经验, 你看这个注册特别不起眼一个事,特别重要一个事。我们最后的成果,一个注册写一个五百页的白皮书,所有的案例,所有的解决方案,特别细致。这个过程中最后 得到了什么,得到了北京速度,你去查一定查到我,就是APEC北京速度怎么诞生的。当时中央领导去APEC现场检查工作看了两个地方,知识管理一个注册中心,一个 新闻中心,就看这两个地方。这是一个比较得意一个案例,把整个的思考应用到实际过程中产生明显效果,这么一个案例。今天也是时间关系不能深入的展 开。
       包括我们现在正在做的,前几个从这儿开始已经做完了,这儿我们今年国际重点城市优质资源共享挖掘和分析这么一个项目。另外一个就是我们明年跟业务处室沟通交 流,做境外风险预警和应急处置的项目。刚才讲顶层设计,顶层设计落实到具体一个一个项目,没有钱的支撑,你那些东西没有用,但是在我这个里头,只不过我自 己藏了私,在这些项目中加入了一些知识管理,我认为比较关键的一些领域的研究,这是我大概实施的路径,刚才从从上到下。这张图从下到上,我们外事办有日程 日志,这是我们一个员工,他的一个员工日志比较有特点,这个坚持了六年,给很多单位演示过这个东西,谁都不相信,你们员工把所有每一天所有的事情记下来, 绝对记下来,这是其中的员工,每天的事情,每天干什么,但是这个员工有一个特点,当时的要求,大家看,这是一个预想,国际组织冒号,这些项目写在日程中, 跟背后的项目文档是关联的,只要在这儿写,我们的那个项目文档自动抽取出来,不仅把他的项目过程记录下来,还会把他的项目日志给记录下来,我们中心是这 样,两个特点,一个日程日志大家看到是日程,我今天参加一场会写在这儿。但是我们有一个日志,你这个会议纪要在哪儿,或者有没有资料,有没有体会,你要是 没有,在考勤考核中不算数,用这种规定凝固起来。我们思路让员工有意识建立一个文件夹,按这个规定做,我背后的文档自动归档,不仅记录他的成果,还记录他 的过程,这该是我们从下往上的做知识管理
       这个是我们自己研究一些成果,这张图实际上第三个成果,我们电子文件元数据智能分析流程,其它的成果,后来跟人大的老师沟通交流,考核工作人员不是写多少文 章怎么发表,有这个方案,方案实施的效果怎么样,考核这个。这是其中一项,刚才我说从上到下,现在从下到上具体细节的问题,比如说数据准备,做数据挖掘过 程中,做知识管理中,这个知识的准备,根据我们的经验大概占60%到70%的时间。我们做知识管理取得哪些成绩,包括我们信息中心拿北京市科技进步二等 奖,包括2007到2013年拿到优秀外文版,这个知识管理没有深入分享,涉及到中国人和外国人的知识交互一个问题,拿钥讲的话,单独讲一下午,中国人和外国人怎么做知识管理。我们自己运维的北京外事网站评到经信委优秀政务网站,后来不搞了,每年都是我们拿第一。我们用知识管理的技术和研究的成果用到这 儿,领导很满意,怎么让领导支持,说一堆虚的没有用,做到实际的成果领导自然支持你,我们做的电子文件元数据自动采集及智能分析市政研究,也是获得国家档 案局二等奖。
        这是讲的数据准备,其实在我们这样一个环节,从采集、转换、清洗、归一、地图、数据标引、后台处理、创建索引,这是我们做得环节。这里头比如说数据清洗,表 面看是技术问题,实际上我们知识管理的问题,就以标点符号为例,在我们那个地方,文档人员,写这个人员,程序编程人员,明确的出,一个逗号清洗作出什么样 的文档出来,大家都觉得,好像觉得无所谓,真正数据清洗的好,一定在这个地方下工夫。包括知识地图,这个知识地图是给我们科委做的一个项目中,刚才我说全 球科技情报数据挖掘,后来给大家解释。这里头说做的动态多维知识地图,我们研究成果,大数据关联性,但是里头有没有可能从大数据里头带来它的上下的关系, 带来它的因果关系,它的同类关系,有没有可能,我个人认为还是有可能的,但是这里头不深入展开,大家提醒一下,我们的研究成果,大数据一定要利用,中间有 一个知识地图支撑它,要看大家论文要支持它。关键明白这个道理,你怎么快速构建,刚才讲的过程中,大家有没有注意到,其中一项研究成果就是快速构建,到底 用什么方法快速构建。比如说以这个为例,做这个东西,我们的人一点都不懂,不懂这个,不代表做出它的知识地图,我们用特殊的方法做这个,整个的架构。
就看到,一提炼,因为外事要转型,外事转型就业务创新,业务转型怎么转,现在外事为民,中央的外交服务,到底是哪些,与重大事件相关的机构、人物、主题,特 定人物的人际关系,我们要分析奥巴马,我们要分析默克尔,当时的目的判断默克尔会不会连任,这是一个非常明确的,包括一些国外的著名媒体报道特征和倾向, 重大国际事件发展趋势和关联特征,著名城市发展的路径和优势领域,以及非政府的活动领域和活动地域,著名企业的投资领域和活动特点。从这里头,不知道有没 有什么感受,这其实需要很多隐性知识,都是一些涉及到业务创新,都没有现成的答案。我们现在要说做这个它的动力是什么,在我们看来,怎么能够把隐性的知识 显现化,比如说默克尔的问题,中国驻德国的使馆有一个判断,关于石油价格一个判断,我们有我们自己的观点,这里头也说一说结论,但是过程不会说,我们判断 石油的价格基本上触底,这个持续两年时间,国际的油价在50到60美元之间,但是怎么判断,有我们大量的分析。
       这个是其中一个应用,刚才说隐性知识显性化,怎么让领导满意,这是一个外办的网站,我们特殊的频道,这是友好交往的频道,这个网站里头,最特殊一个对这些城 市采纳的新闻,我们当时围绕的就是公共外交,这是我们外事转型中一大领域,围绕公共外交,围绕经贸关系来做。但是整个这一个,全是机器做的,效果怎么样, 大家回去如果有兴趣上网看,绝大多数想象不到,这一个是没有任何人干预,完全用机器做。怎么采,不是说乌兰巴托布地图的采集地图,我要采购乌兰巴托采用 20段字符段,在后面几个词,一般说我们6个词以内,我们配好自动采,我们为什么拿第一,连续两年网站更新全市排第二,当时为什么排第二,我跟我们领导 说,你想不想拿第一,你想拿第一就拿第一,别拿第一,别招眼,所以我们控制,其实我们能够拿第一、第二更重要是什么呢,我们控制能拿第几。包括我们这次在 做北京速度,北京速度真正快吗,不是,北京速度意义在于我们能够控制从注册到拿证件的时间,我们能够控制。控制意味着什么,意味着对每一个环节有绝对的掌 控,才能做到控制,跟这个道理是一样的,这个后来领导就非常满意,没有花钱,一个钱没有花,跟政府委办局说,他们不信,中国的网站北京外事,视频讲外语, 我们一个英文三个中文,我们做网站的三个人,你们能想象吗?如果真正要看一北京的网站涉及到另外一个问题,就是说一北京的网站很多人认为不是中国人做的, 都认为是外国人的做的,他的交互方式、体验方式与众不同,我们连着七年的拿奖,这里是外国人的沟通和交流的知识,我们就三个人做这个事,一般人很难想象。
       这是我们做的奥巴马人际关系网,这就是分析,我们分析这儿,不是看他一个,我们可以比,奥巴马和习大大人际关系的交集比,奥巴马这五年和过去五年还可以 比,就有情报价,这就是隐性的知识。这是我们拿的APEC和东盟,用的主题是相同的,外面是不同的,用主题来判断的,还可以用人来判断,用这个来找里头一 些规律和特征。这是我们给科委做的纯英文的,全球科技的最新的热点,包括高级科技人才,当时科委给了我们五个领域,我们采的范围是全球的专利库,论文库和 产业新闻,全球的专利包括美国的、欧洲的、日本的等等,这些专利库,为什么涉及到一个数据归一的问题,看到是这样,里头每一个元数字都不相同,怎么归一, 对全球的期刊特别的熟悉,我们做了这方面的研究。这个是当时的设计上升到另外一个阶段,我在跟设计公司讨论一个方案的时候,当时提了做全球科技系统,就一 条,就是科技一定要贴近生活,怎么你能够体现出科技贴近生活,所以最后我们的创意弄成了,地铁图,我们还要铅笔图,全是生活中日常的用品来展现一个高科技 的形象,这就是我们最后一个设计,因为在我们看来这种设计真正拉近人和科技的。当然距离越近,表示它的关系强度越强。
       这张我们对科研资金方向评估一个分析图,这个科委跟我们的需求也很多,全球的科技热点,五个热点是什么,趋势是什么,这五个热点里面研究热点是哪些,但是了 解这些不是最重要的。了解最重要是科委一条,我北京市科研资金投资,到底什么阶段投哪个方向,要的这个,这里头做大致的判断,我们这种颜色,这个颜色是期 刊,这个是专利,一个科技领域,一个催化剂,这个图马上显示,这个里头专利很少,期刊很多,产业新闻很少,说明什么问题,期刊很多,专利很少,就说明现在 研究的人多,但是真正突破的少。这个时候北京市科委要投钱有风险,但是有风险的同时也有可能,你的收益最大化,但是反过来又不一样,有些地方就不一样。实 际上这种利用叫叠加分析,我们最后做的石油就是叠加政治主题和所有的大宗交易市场的趋势图,石油的价格表,和我们政治之间的关系是共振和反振做的思路和判 断。
 
 

相关推荐