字节跳动实习总结

工作总结

在字节跳动-今日头条主要负责了4个大方向上的业务

  • 增长承接业务
  • 端智能tips需求
  • 全网资源相关建设
    • 站外优化
      • 站外视频加速
      • 站外转码数据离线链路搭建
      • 站外小说资源加速
    • 影视资源实体挖掘

实习项目理解和思考

具体描述每一块业务做了什么事情

全网资源相关建设 | 主要 own 的方向

Q: 什么是全网资源

A:全网资源就是你用手机浏览器去搜索各种影视和小说相关的资源,这一些资源统称为全网资源

Q: 为什么做全网资源

A:用户在手机浏览器搜索全网资源是最常见的事,渗透高达25%以上,因此做好全网资源可以吸引更多用户使用我们的浏览器

以上是对全网资源的一个背景介绍,我主要的工作是优化用户对全网资源的体验,接下来详细介绍

站外优化

站外视频加速

背景

大部分用户通过浏览器搜索盗版视频进行消费,目前大部分盗版视频都是通过HLS协议进行传输。

因此这个项目背景就是根据HLS协议进行视频加速的优化

额外知识

项目中需要了解的额外知识

HLS协议是什么

一句话描述:HLS 协议,用 HTTP 协议传输视频资源文件

其中视频文件分为 M3U8 和 TS 文件

  • M3U8:作为索引文件,存放的几百个TS文件的URL
  • TS: ts文件是视频文件,一个ts文件就是一秒钟的视频
目标

优化首帧观看到时间1s以上

方案

服务端缓存 M3U8 和部分 TS文件

下面描述方案细节

  • 采用TOS进行存储,字节跳动的一个对象存储系统
  • 优化HLS协议交互流程,针对两级的M3U8文件,当客户端请求第一级的M3U8文件的时候直接返回第二级M3U8
  • 优化TS文件的请求,当客户端请求TS文件的时候,服务端直接返回缓存的TS文件
  • 异步缓存
成果

实验中成功优化首帧时延1s以上

站外转码数据离线链路搭建

背景
目标
方案
成果

站外小说资源加速

背景
目标
方案
成果

影视资源实体挖掘

主要负责的工作是从小、中视频中根据ocr提取出关键字判断该视频是在描述什么电影,解析出来让用户知道。

杂活 | 增长承接业务 | 端智能tips业务