知识管理 知识管理
首页
  • 前端文章

    • JavaScript
    • HTML
    • CSS
  • 学习笔记

    • 《JavaScript教程》
    • 《JavaScript高级程序设计》
    • 《ES6 教程》
    • 《Vue》
    • 《React》
    • 《TypeScript 从零实现 axios》
    • TypeScript
    • JS设计模式总结
  • 技术文档

    • Git使用手册
    • Markdown使用教程
    • npm常用命令
    • npm packageJson属性详解
    • yaml语言教程
  • 前端面试

    • 前端面试手册
  • 计算机基础

    • 数据库
    • 操作系统
    • 计算机网络
    • Linux
  • Java

    • Java基础
  • 数据结构与算法

    • 数据结构
  • 编程标准

    • 设计模式
    • 代码规范
  • 学习笔记

    • AI学习笔记
  • 推荐系统

    • 机器学习基础
    • 基础推荐算法
    • 深度推荐模型
    • 推荐系统竞赛实践
    • 新闻推荐系统实战
    • 推荐系统面经
  • 计算机视觉

    • 三维重建
关于
收藏
友链
  • 分类
  • 标签
  • 归档
GitHub (opens new window)

Francis

人一定要想象西西弗斯的快乐,因为向着高处挣扎本身足以填满一个人的心灵。
首页
  • 前端文章

    • JavaScript
    • HTML
    • CSS
  • 学习笔记

    • 《JavaScript教程》
    • 《JavaScript高级程序设计》
    • 《ES6 教程》
    • 《Vue》
    • 《React》
    • 《TypeScript 从零实现 axios》
    • TypeScript
    • JS设计模式总结
  • 技术文档

    • Git使用手册
    • Markdown使用教程
    • npm常用命令
    • npm packageJson属性详解
    • yaml语言教程
  • 前端面试

    • 前端面试手册
  • 计算机基础

    • 数据库
    • 操作系统
    • 计算机网络
    • Linux
  • Java

    • Java基础
  • 数据结构与算法

    • 数据结构
  • 编程标准

    • 设计模式
    • 代码规范
  • 学习笔记

    • AI学习笔记
  • 推荐系统

    • 机器学习基础
    • 基础推荐算法
    • 深度推荐模型
    • 推荐系统竞赛实践
    • 新闻推荐系统实战
    • 推荐系统面经
  • 计算机视觉

    • 三维重建
关于
收藏
友链
  • 分类
  • 标签
  • 归档
GitHub (opens new window)
  • 计算机视觉

  • 推荐系统

    • 机器学习基础

    • 基础推荐算法

    • 深度推荐模型

    • 推荐系统竞赛实践

      • readme
        • 推荐系统实践(新闻推荐)
        • 数据下载
        • 基本信息
        • 学习目标
          • 熟悉推荐系统竞赛的基本流程
          • 新闻推荐入门赛学习内容汇总:
        • 任务安排
          • Task00:熟悉规则(1天)
          • Task01:赛题理解+Baseline(3天)
          • Task02:数据分析(2天)
          • Task03:多路召回(3天)
          • Task04:特征工程(3天)
          • Task05:排序模型+模型融合(3天)
        • 关于Datawhale
        • 其他组队学习
      • 赛题理解+Baseline
      • 数据分析
      • 多路召回
      • 特征工程
      • 排序模型+模型融合
    • 新闻推荐系统实战

    • 推荐算法面经

  • AI
  • 推荐系统
  • 推荐系统竞赛实践
IdealDestructor
2021-12-12

readme

# 推荐系统实践(新闻推荐)

# 数据下载

链接:https://pan.baidu.com/s/15ReHXSM6VlQP-usia0DgYw 提取码:135r

# 基本信息

  • 学习周期:15天
  • 学习形式:理论学习+练习
  • 人群定位:有一定的数据分析基础,了解推荐系统基本算法,了解机器学习算法流程
  • 先修内容:Python编程语言 (opens new window);编程实践(Pandas) (opens new window);编程实践(Numpy) (opens new window);推荐系统基础 (opens new window)。
  • 难度系数:中

# 学习目标

# 熟悉推荐系统竞赛的基本流程

  • 掌握数据分析方法
  • 了解多路召回策略
  • 了解冷启动策略
  • 了解排序特征的构造方法
  • 了解常见的排序模型
  • 了解模型融合

# 新闻推荐入门赛学习内容汇总:

# 任务安排

# Task00:熟悉规则(1天)

  • 组队、修改群昵称
  • 熟悉打开规则

# Task01:赛题理解+Baseline(3天)

  • 理解赛题数据和目标,理解评分指标,了解赛题的解题思路
  • 完成赛题报名和数据下载,跑通Baseline并成功提交结果

# Task02:数据分析(2天)

  • 了解数据中不同文件所包含的信息,不同数据文件之间的关系
  • 分析点击数据中用户的点击环境、点击偏好,点击的文章属性等分布
  • 分析点击数据中文章的基本属性,文章的热门程度,文章的共现情况等
  • 分析文章属性文件中(embedding文件和属性特征文件),文章的基本信息

# Task03:多路召回(3天)

  • 熟悉常见的召回策略,如:itemcf, usercf以及深度模型召回等
  • 了解当前场景下的冷启动问题,及常见解决策略,了解如何将多路召回的结果进行合并
  • 完成多种策略的召回,冷启动及多路召回合并
  • 完成召回策略的调参和召回效果的评估

# Task04:特征工程(3天)

  • 了解排序数据标签的构建,训练数据的负采样,排序特征的常用构造思路
  • 完成用户召回文章与历史文章相关性的特征构造
  • 完成用户历史兴趣的相关特征的提取,文章本身属性特征的提取

# Task05:排序模型+模型融合(3天)

  • 了解基本的排序模型,模型的训练和测试,常用的模型融合策略
  • 完成LGB分类模型,LGB排序模型,及深度模型中的DIN模型的训练、验证及调参
  • 完成加权融合与Staking融合两种融合策略

# 关于Datawhale

Datawhale是一个专注于数据科学与AI领域的开源组织,汇集了众多领域院校和知名企业的优秀学习者,聚合了一群有开源精神和探索精神的团队成员。Datawhale 以“for the learner,和学习者一起成长”为愿景,鼓励真实地展现自我、开放包容、互信互助、敢于试错和勇于担当。同时 Datawhale 用开源的理念去探索开源内容、开源学习和开源方案,赋能人才培养,助力人才成长,建立起人与人,人与知识,人与企业和人与未来的联结。 本次数据挖掘路径学习,专题知识将在天池分享,详情可关注Datawhale(二维码在上面)

# 其他组队学习

有关组队学习的开源内容

  • team-learning (opens new window):主要展示Datawhale的组队学习计划。
  • team-learning-program (opens new window):主要存储Datawhale组队学习中“编程、数据结构与算法”方向的资料。
  • team-learning-data-mining (opens new window):主要存储Datawhale组队学习中“数据挖掘/机器学习”方向的资料。
  • team-learning-nlp (opens new window):主要存储Datawhale组队学习中“自然语言处理”方向的资料。
  • team-learning-cv (opens new window):主要存储Datawhale组队学习中“计算机视觉”方向的资料。
  • team-learning-rs (opens new window):主要存储Datawhale组队学习中“推荐系统”方向的资料。
  • team-learning-rl (opens new window):主要存储Datawhale组队学习中“强化学习”方向的资料。
编辑 (opens new window)
上次更新: 2022/01/04, 02:41:54
多任务学习
赛题理解+Baseline

← 多任务学习 赛题理解+Baseline→

最近更新
01
前端基础及Vue实战
01-04
02
flask简介及基础
01-04
03
前后端交互
01-04
更多文章>
Theme by Vdoing | Copyright © 2022-2022 Francis | MIT License
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式
×