本篇文章4150字,读完约10分钟

热点聚集

4416个单词,阅读大约需要6分钟 微博是一个传播社会互动的互联网平台,通过利益机制分享短期新闻。微博客户关注订阅短信。在这种情况下,推荐系统可以很好地与订阅系统集成,相互促进。微博有两个关键基础:一是建立客户关系;第二,文本信息表达微博致力于优化这两点,促进微博的快速发展。 微博推荐开发流程改变了系统方向,业务不断变化,目标重置,产品理念、架构、算法都发生了变化。本白皮书首先描述了推荐架构在这一过程中的演变,希望借此机会探讨业务与技术的关系,从产品目标、算法需求、技术开发等方面为网友提供一个完善的开发环境。 通常,架构是在团队和业务环境中创建的,并努力基于环境因素处理环境问题。该结构由强大的功能组成,同时创建面向实现的效果。本白皮书详细介绍了微博提案的三个阶段,包括环境因素、架构配置和特点、实施影响。 1独立1.0 1.1环境 影响结构形成的环境因素可分为内部环境因素和外部环境因素。内部因素主要与团队和成员有关,外部因素主要与外部部门、整个企业或整个领域有关。 这个项目有很多项目。当时每个团队平均有5个并行开发项目。当然最重要的因素是微博产品是快速发电机,微博很多地方需要提供支持。而且由于项目周期短,进度紧迫,不容易有时间清理和抽象。典型产品有微棒、微群、微分布、微结构、客户、文字对齐。 基于以上原因,当我们面对一个单一的项目时,我们通过构建自己的理解,使用熟悉的技术栈来一个一个地构建我们的流程。 虽然在开发过程中有很多不足,但是我们已经为后续的架构优化打下了基础。结果如下。 微博在快速发展的过程中,满足了推荐服务支持的要求,完成了20多个独立项目。 吴的框架诞生了,内部高效计算框架也诞生在这里。 总结web应用层的持续诉求,推荐通用应用框架配置2/F 2.0 我们引入了一个独立的1.0。按照建筑发展的方法,我们走了一条支路,一条是流行的灯式建筑,一条是与广告、搜索相匹配的单元式建筑。lamp架构的数据策略是独立的,脚本语言是业务开发的主要语言。这个项目是快速开发和迭代的首选。单元架构强调本地流程解决方案、数据和业务组合、自开发服务和适用于高性能应用的数据库。毕竟我们选择两者兼容,倾向于业务架构。为什么会这样?我们来看看当时的环境。 2.1环境 微博2.0的推荐周期是2013年3月到2014年底。这一时期的内部环境因素有: 今天,团队成员长期合作,在技术选择上达成共识。 团队产品侧重于文本/客户/垂直课程推荐,场景分为源主页、文本页面和个人电脑主页。这种专注不仅有助于统一建筑,也有助于获得技能。 外部因素包括: 企业确定定位建议,提高关系绩效和文本信息表达效率,为推荐广告的技术探索、场景介入和客户体验提供依据。 在推荐领域,每个企业都有自己的架构输出,这是微博建议的重要指南。 2.2架构配置和功能 随着团队对核心业务的实施,工具和框架发展迅速,2.0部署的目标正在成为现实。 1.技术目标 与1.0不同,2.0的技术目标不再仅仅是实现业务需求。要获得完整的推荐流程,您需要: 第一步是实施完善的推荐流程,包括候选人选择、调整、策略、论证、反馈和判断。 数据是提取数据模式的第一个数据。为了实现数据对比,效果是基于数据,实现数据通道,反映反馈,实现数据落地,实现领域事务需求。 它提供了一种方便的方法来干预算法。 这不仅可以保证快速迭代和业务开发,还可以支持高效计算。 2.体系结构 微博推荐2.0的架构如图5所示。它不再是一个独立的系统,开发者不能使用类似的技术来处理类似的问题。体系结构图主要包括以下几个部分: 应用层:主要负责推荐策略和演示,其优点是充分利用脚本语言的特点来响应重复的需求。对齐后,您可以显示大多数推荐文本,但这一io密集型层必须在技术层面完成,因为您需要合并、删除和重新定位前端产品策略。在技术选择的框架下,开发最初基于apache+mod_python,创建了common _ recon _ frame。该框架面向能够成功实现推荐业务流程的二级开发人员。该框架的核心思想是提取项目、任务和数据三层接口。本项目适用于各种推荐项目,每个推荐项目的推荐任务不同,是一种管理访问方式。两种规格和设置。一是集成推荐的接口,不考虑客户、上下文或域,二是通过保护不同协议数据库的访问实践,显著提高开发效率。common _ recon _ frame框架的出现,基本上是处理产品的各种推荐策略的需求,走在产品的前面。图5微博推荐2.0架构示意图 计算层:cpu是主要消耗。该层为算法提供干预措施,并执行支持算法模型迭代的推荐排序计算。在这个技术选择层,我们继承了原有的woo协议框架,这是一个基于c/c ++开发的内部高效通信框架。当然,我做过很多扩展。同时,我借用了上面提到的common _ recom _ frame思想,实现了基于woo框架的项目/实践/数据管理,为二次开发人员提供了更高效的开发工具。将此工具包含在您团队的开源项目中 数据层:主要负责推荐的数据流和存储。数据层的首要任务是处理数据的入/出/存储问题。数据输入到系统中,输出是一种数据访问方法,存储是一种数据存储方法。规划数据层时,分析微博推荐的数据特征,分为静态和动态两类。静态数据定义如下:更新需要的数据量大,频率低,并发性低,动态数据定义为增量数据,动态更新频率高。正因为如此,在静态和动态数据的生成过程中,rin/r9接口、radial/lumen、tmproxy/呼吸机或工具框架是唯一的输入/输出/软件的一般方向。先说扩展:rin数据访问动态数据,支持通过web服务接收数据,管理后端队列。客户集群由多服务框架ckestrel补充,客户需要执行自己的业务开发。可以在线快速采用动态数据。r9接口求解器访问静态数据的推荐行为对比r9接口框架下hadoop集群的静态计算【mr hive sql和spark行为】,通知管理和数据加载,处理很多静态数据。多个redis集群用于动态数据,庐山集群用于静态数据来存储推荐数据。对于鲁山来说,这个工具也包含在团队开源项目中:github/WB建议/鲁山。为了处理出数据的问题,tmproxy/通风结合通风访问中间件代理来解决静态和动态数据的推荐请求,减少业务变化的影响。基础服务:推荐系统的基础服务主要包括监控、报警和判断系统。数据监控系统分为性能监控和影响监控,判断系统主要用于下属判断。去之前有一定的期待和影响。 3.优势 优点是: 数据集成实践提供完善的推荐流程支持 在快速实现业务功能的过程中,效果技术不断深化。 该算法得到了很好的支持。 第一次采纳你的数据的想法,有助于你全面比较自己的影响力,继续提升推荐效果。 密封系统易于放置,测试中包含质量保证。 缺陷如下。 离推荐核心有一定距离,与推荐不完全一致。 推荐的策略算法完全传播给开发者,不适合普遍采用。 算法培训不包括在内,只有在线投放系统,因为这个完善的推荐系统是不够的。 2.3结果 微博推荐2.0的诞生,产生了不错的效果。 微博的核心业务是通过组织推荐、趋势客户推荐、趋势文本推荐、各种场景下的客户推荐、粉丝经济学、账号推荐等系统来完成的。 为lab_common_so创建一个基本框架并实现开源 一个静态存储集群处理方案,庐山,诞生了。 联阵框架的诞生大大提高了该公司的生产效率,并为开放社区作出了贡献。 3平台类型3.0 前一节2.0描述中提到的第一个缺点是,与推荐的核心有一定的距离,与推荐不完全一致。我们希望在建议3.0中修复它。为什么推荐的架构在满足业务需求的同时继续快速发展?我们会给大家展示微博推荐的平台风格3.0设计。我们来看看环境。 3.1环境 目前2014年底至今的内部环境因素如下,微博推荐3.0。 推荐的产品不延伸,但更重要。同时,关键工作开发和迭代转向性能比较的技术迭代。 如果您以迭代的方式提出一个新的项目或业务,将会有多个重复的任务,这些重复的任务是因为模式没有被处理。 外部因素包括: 该企业还扩大了工作范围,优先考虑效率,以改善客户体验和文本质量。 微博建议推荐技术链接的距离区有一定距离,有追赶的情况。 3.2架构配置和功能 目前的环境也能体现3.0的技术目标。 1.技术目标 与2.0不同,全面的推荐过程不是3.0的目标。目标是总结推荐过程中候选人/协调/培训/反馈的常见做法。 推荐算法需要建立推荐系统算法的位置数据问题,并探讨算法策略 2.体系结构 如图7所示,建议在这个开发2.0的基础上寻找微博3.0的架构,因为运行目前的架构体系,我们维护的是一个大规模的分层体系和框架2.0中实际采用的工具。以下是一个关键点: 两个标准:应用层的一个整体输出框架,都是一个应用层包含标准输入输出参数的接口规范,同时关联动态输入lean和离线计算,可以理清我们的结构。因此,输入层工具r9的接口规范是相互依赖的。* * *分区级别的标准设置不需要设置行字符串,比如数据/记录。 通过生成候选项的标准方法添加计算层:artemis候选文本模块、项目候选客户模块、...应该只选择这种方法来生成项目开发的候选项。 增加了一个战术平台eros来处理算法模型问题。eros的主要优点是1)训练模型2)特征选择3)在线比较测试。 r9接口层和用于在线和离线生成精益增长候选的数据推荐了产生结果的通用策略。 图7微博推荐3.0示意图 3.优势 它首先解释了它的优点: 它继承了2.0的原有特性,保持了它的优势。深入理解这些建议,结合推荐候选/对齐/训练算法最重要的处理方案 3.3结果 微博推荐3.0诞生,结果如下: 微博推荐的核心业务逐渐向系统迁移,算法数据是提高效率的驱动因素。 技术来源于业务,促进业务的快速发展。业务的快速发展是技术快速发展和相互影响的背后动力。随着商业的快速发展,技术仍然存在。 技术架构选择的建议是找到最短路径,然后迭代优化。把一切都放在一起是不现实的,也是不合理的。 宣传框架和工具的最好方式不是行政命令或处理,而是每个人都是参与者。和开源项目一样,每个人都是所有者,因为每个人都是被维护和采纳的。

上一篇:「推广心得」互联网软性广告对营销有什么不一样的错误思想呢

下一篇:没有了


标题:「推广心得」关于新浪微博推荐系统架构演进过程    
  地址:http://www.wenfangge.com/rwfb/2020/1122/2567.html


注明“来源:文芳阁”的所有作品,版权均属于文芳阁软文推广平台,未经本网授权不得转载、摘编或利用其它方式使用上述作品,如有对内有异议请及时联系btr2030@163.com,本人将予以删除。