| 公司背景 |
| 上海日报诞生于1999年10月1日,是中国第一份地方性英文报纸,并由国内最大的报业集团文汇新闻联合报业集团出版发行。目前是上海地区最具影响力的英文大报,在中国经济发展活跃的长三角地区和华东地区和华东地区都有深远的辐射力。《上海日报》是一张将敏锐的新闻视角、成熟的新闻价值、打起的办报风格和完善的服务咨询完美结合的英文大报,目前日刊,每期48页,有效发行量110.000份。 |
| 企业需求 |
上海日报每周六期,主要报道上海及国内的经济、社会和文化活动,介绍中国的改革开放、对外交流、上海的投资环境和百姓生活,为在沪工作和旅游的外国人 提供信息服务。此外,报纸每天都全面报道世界各地的热点新闻、科技动态、生活潮流等。所以上海日报信息源需求量极大,除了来自互联网和其自己采集的信息外还需要很多定制的信息源进行信息的采集。时间是衡量新闻优劣的很重要的因素,实时新闻采集和发布是上海日报的一个重要需求。
上海日报的服务对象主要是在上海工作和生活的外籍人士和每年两百多万的 入境客人,但其实际读者中约一半为国内高级白领和专业人士。上海日报每周一至周六出版,每天20个版面,包括城市新闻,国内新闻,国际新闻,体育新闻,商业报道及特色版面。目标读者也包括8万旅居中国的外籍人士,每年2百万海外旅游者,以及大量的中国专业读者。如此多的新闻类别,如此专业的阅读人群,导致上海日报必须将新闻的类别定的十分细致,如此才能满足行业专业领域阅读者的阅读需求。
|
| 解决方案 |
新闻自动采集
Cooling Search 的 spider (网络爬虫)是采集新闻信息的能手。他可以从互联网抓取海量的信息并且提供非结构化信息的有效存储。Cooling Search 支持多种信息源,包括:互联网,关系型数据库,定制信息源等。用户可以指定信息源,系统会自动实时进行信息采集。
新闻自动分类
机器通过自动学习样本文章,建立知识模型。Cooling Search 拥有自己的行业目录,用户可依据个人喜好或根据行业需要,定制分类信息。机器从 大量信息中,通过语义级搜索,真正有价值的信息并对获得的信息按照 Cooling 自己的行业目录进行自动分类。Cooling Search 独有的自定义数据挖掘模型,分析用户行为与各类信息,按照用户需求的变动,不断完善行业目录,使分类更符合用户的实际需要。
相关资料查询
往往一则信息很难全面的覆盖新闻的方方面面。举例来说,一个用户看到一篇新闻报道“世博园区80%已经建设完毕”之后还想了解关于世博的更多信息,比如:2010世博召开所在的具体地址,世博的历史等等。Cooling Search 考虑到用户深层需求,在保证新闻分类的准确性的同时提供给用户相关资料查询功能,为用户搜索出与新闻相关的信息,为用户提供更多有用的信息,使搜索变得更方便。 |
| 收益 |
Cooling Search 提供多个子系统满足用户需要非常精确的搜索结果的需求。 Cooling Search 通过不断地与上海日报沟通当前流行的类别划分,将原本的大类例如:经济,体育等细化成更小的单元,例如:微观经济,宏观经济等。使用户搜索到的内容更符合自己的理想标准。Cooling Search 根据上海日报的客户对行业细致化的要求。将经济分成29个小行业,体育分成32个小分类,另外还有旅游,天气,科技这些细小分类12个。如此一来,用户可以随心所欲的订阅他们想要了解的个性化新闻。
由于上海日报需要对他们制定的信息源进行信息的采集和实时的推送。Cooling Search 的爬虫每天从上海日报定制的信息源中爬取当日的全部信息,经过系统的分析将海量的新闻划入准确的分类中。日日更新事实推送。读者就可以阅读到当天最新的新闻信息。
|
| |