检索技术核心20讲- 极客时间课程推荐/优惠

检索技术核心20讲--极客时间课程推荐/优惠

从搜索引擎到推荐引擎,带你吃透检索
陈东前数禾科技CTO,前奇虎360商业化资深总监
专栏 | 29讲 | 21893人已学习
优惠价¥59原价:99
去官网优惠购买

版权声明

本站非极客时间官网,与官方无任何关系。我们不提供课程下载或详细内容,仅作为课程分享和推荐平台。我们鼓励大家支持正版,尊重创作者的劳动成果,这样不仅能帮助创作者持续产出优质内容,也能让自己获得更好的学习体验。请通过官方渠道购买和学习课程,感谢您的理解与支持。

课程详情

你将获得

  • 5 类数据结构的原理和应用;
  • 15+ 行业真实应用案例详解;
  • 4 大热门行业检索架构和设计;
  • 从基础到实践,构建检索知识体系。

课程介绍

在日常的工作或者面试中,经常会遇到一些与查询相关的问题,比如:

  • 如何从海量数据中查询同时带有“极”和“客”字的唐诗?
  • 为什么很多日志系统使用NoSQL数据库而不是关系型数据库?
  • 在爬虫系统抓取网页之前,如何快速判断一个URL是否已经被抓取过?

其实,这些问题都属于检索技术的研究范畴。检索技术已经成为互联网时代技术人必不可少的技能之一,因为其应用极其广泛。

一方面,很多平台的架构设计都有相似的检索模块,比如搜索、推荐、广告等;另一方面,用好检索技术还可以帮助我们有效提升程序的执行效率,比如,只要我们能合理地使用数据库的索引功能,那程序从数据库中检索相关数据的速度就能提升好几倍。

在这个专栏中,陈东会通过20篇文章,将他十多年打造高性能广告引擎的工作经验,以及针对各种检索业务的深入思考和理解分享出来。带你系统地学习高效的检索方案和设计思想到底有哪些,到底怎么用;并且会结合工业界中的具体业务场景,从最简单的解决方案入手,一步一步带你分析各种方案的优缺点,找到最优解。

专栏共包含三个模块,分别是基础技术篇、进阶实战篇和系统案例篇。

基础技术篇:聚焦5大类核心的数据结构和检索算法,包括线性结构检索、非线性结构检索、哈希检索等,着重讲解它们的存储特点和检索效率,帮你理解检索技术的本质,并且能够在代码级别提升运行效率。

进阶实战篇:分析工业界中的高效检索方案,详细讲解其中涉及的高级检索技术,总结一些架构设计思想,比如,读写分离、索引和数据分离、空间检索、Top K搜索。掌握这些设计思想和高级技术能够大幅度提升检索效率,帮你解决实际工作中的检索难题。

系统案例篇:剖析当前热门的存储系统、搜索引擎、广告引擎、推荐引擎。学习这些系统是如何应用检索技术架构的、关键环节如何处理,从而帮你扩大知识面,拥有架构师、设计者视角,能够从更高的角度去思考问题、解决问题。

课程目录

课前必学

  • 开篇词 | 学会检索,快人一步!
  • 导读 | 三步走策略,轻松搞定检索!

基础技术篇

  • 01 | 线性结构检索:从数组和链表的原理初窥检索本质
  • 02 | 非线性结构检索:数据频繁变化的情况下,如何高效检索?
  • 03 | 哈希检索:如何根据用户ID快速查询用户信息?
  • 04 | 状态检索:如何快速判断一个用户是否存在?
  • 05 | 倒排索引:如何从海量数据中查询同时带有“极”和“客”的唐诗?
  • 测一测 | 检索算法基础,你掌握了多少?
  • 特别加餐 | 倒排检索加速(一):工业界如何利用跳表、哈希表、位图进行加速?
  • 特别加餐 | 倒排检索加速(二):如何对联合查询进行加速?

进阶实战篇

  • 06 | 数据库检索:如何使用B+树对海量磁盘数据建立索引?
  • 07 | NoSQL检索:为什么日志系统主要用LSM树而非B+树?
  • 09 | 索引更新:刚发布的文章就能被搜到,这是怎么做到的?
  • 08 | 索引构建:搜索引擎如何为万亿级别网站生成索引?
  • 10 | 索引拆分:大规模检索系统如何使用分布式技术加速检索?
  • 11|精准Top K检索:搜索结果是怎么进行打分排序的?
  • 12 | 非精准Top K检索:如何给检索结果的排序过程装上“加速器”?
  • 13 | 空间检索(上):如何用Geohash实现“查找附近的人”功能?
  • 14 | 空间检索(下):“查找最近的加油站”和“查找附近的人”有何不同?
  • 15 | 最近邻检索(上):如何用局部敏感哈希快速过滤相似文章?
  • 16 | 最近邻检索(下):如何用乘积量化实现“拍照识花”功能?
  • 特别加餐 | 高性能检索系统中的设计漫谈
  • 测一测 | 高性能检索系统的实战知识,你掌握了多少?

系统案例篇

  • 17 | 存储系统:从检索技术角度剖析LevelDB的架构设计思想
  • 18 | 搜索引擎:输入搜索词以后,搜索引擎是怎么工作的?
  • 19 | 广告系统:广告引擎如何做到在0.1s内返回广告信息?
  • 20 | 推荐引擎:没有搜索词,“头条”怎么找到你感兴趣的文章?

结束语

  • 结束语 | 成长和进化,技术如此,我们亦如此
  • 结课测试 | 这些检索知识,你都掌握了吗?

作者介绍

陈东,前数禾科技CTO,以数据和技术驱动,为金融机构提供高效的智能零售金融解决方案。曾任奇虎360商业化资深总监,负责展示广告的研发管理和产品创新。 在互联网广告行业深耕十余年,致力于弹性分布式系统架构、检索引擎与推荐系统等技术方向。

推荐

持续交付36讲 - 极客时间课程推荐/分享/优惠/折扣
持续交付36讲
量身定制你的持续交付体系
王潇俊携程系统研发部总监
专栏 | 40163人已学习
优惠价¥59原价:129
去官网优惠购买
AI技术内参 - 极客时间课程推荐/分享/优惠/折扣
AI技术内参
你的360度人工智能信息助理
洪亮劼Etsy数据科学主管,前雅虎研究院资深科学家
专栏 | 34023人已学习
优惠价¥98原价:299
去官网优惠购买
业务开发算法50讲 - 极客时间课程推荐/分享/优惠/折扣
业务开发算法50讲
从算法的工程实践开始,提升问题解决能力
黄清昊Hashdata 数据库内核工程师,LeetCode高赞答主,公众号微扰理论作者
专栏 | 23933人已学习
优惠价¥59原价:129
去官网优惠购买
重学线性代数 - 极客时间课程推荐/分享/优惠/折扣
重学线性代数
掌握工程应用中的线代知识
朱维刚前阿里云资深技术专家
专栏 | 9295人已学习
优惠价¥59原价:99
去官网优惠购买
程序员的个人财富课 - 极客时间课程推荐/分享/优惠/折扣
程序员的个人财富课
用更少的时间产生更多的收益
王喆Roku推荐系统架构负责人,前hulu高级研究员,《深度学习推荐系统》作者
专栏 | 19358人已学习
优惠价¥68原价:199
去官网优惠购买
快速上手C++数据结构与算法 - 极客时间课程推荐/分享/优惠/折扣
快速上手C++数据结构与算法
手撕优质代码,突破算法难关
王健伟《C++新经典》系列作者,资深C++讲师
专栏 | 3599人已学习
优惠价¥68原价:199
去官网优惠购买