|  | 
 
| 项目背景:
 正则表达式匹配是常见的模式匹配形式之一,它广泛运用于数据预处理和分析领域(如网
 络报文分析,生物信息学,书目检索,等等)。正则匹配在网络报文分析领域的应用最为
 成熟,目前几乎所有的深度报文检测方案(DPI,Deep Packet Inspection)都会使用正则
 语法来描述纷繁复杂的攻击模型,因此正则匹配对于诸多基于报文处理的应用(入侵检测
 /防御系统,应用识别系统,Web应用防火墙,等等)来说,往往是业务流程中避无可避的
 一环,处理性能至关重要。
 
 Hyperscan是目前适配x86平台的、业界性能最好的、支持多规则匹配以及流模式匹配的正
 则表达式匹配库,目前由Intel Shanghai的Hyperscan团队进行开发维护,项目已在GitHu
 b开源,基本信息如下:
 
 https://github.com/intel/hyperscan
 Daily visitors: 400+
 Daily clones: 58+
 # of Fork: 252
 # of Star: 1797
 
 工作内容:
 Hyperscan的高性能,部分得益于对Intel x86平台的单指令多数据(SIMD,Single Instr
 uction Multiple Data)技术的灵活运用,巧妙的数据结构设计能提升运行时涉及匹配操
 作的并发性。此外,整个Hyperscan作为处理正则匹配任务的一个大型算法库,其顶层的设
 计方案也是对传统的纯字符串匹配算法、有限状态自动机(NFA/DFA)理论、图论算法的一
 次高度整合,其设计理念要优于许多传统的单一匹配方案。关于Hyperscan的基本设计哲学
 和算法实现原理,可以进一步参考项目组发表在NSDI 2019的文章:
 
 https://www.usenix.org/conference/nsdi19/presentation/wang-xiang
 
 目前围绕Hyperscan项目的工作涵盖数个方面:
 1. 日常开发和维护。包括feature的常规开发以及bug fixing,这些feature或bug可能来
 自社区和用户的反馈,也可能来自项目组对某些功能或性能的自主调研,尤其要是保持对
 Intel新处理器的宽指令集特性的追踪。
 2. 新领域的探索和结合。包括推进Hyperscan项目本身和其他关联项目的整合(例如IPS/
 IDS,WAF,Database等等),分析Hyperscan的技术经验和其他新技术场景的可能结合,探
 索更多的正则匹配的应用领域(包括但不限于网络领域)。
 3. 项目的学术呈现。我们会基于Hyperscan本身的技术特点和经验积累,撰写相关技术总
 结报告甚至学术性文章,也包括其他可能的呈现形式(例如书籍),积极发表和推广,旨
 在将项目内化的许多优秀设计理念和算法精髓与更多人分享。
 
 实习要求:
 - 会写一点点C/C++
 - 用过一点点Linux
 - 了解一点点正则表达式
 - 了解一点点自动机的知识
 - 了解一点点图领域的基本算法
 - 单纯喜欢开源项目
 - 英文书写能力不错
 
 如果你满足上述条件之一,欢迎投递个人简历!
 
 简历请提交至邮箱: yang.a.hong@intel.com
 邮件标题: Intel_Hyperscan_Intern_CV (Your Name)
 工作地点: 紫星路588号(上海紫竹科技园内)
 
 --
 往事不想再提,人生已多风雨
 纵然记忆抹不去,爱与恨都扔进垃圾
 你是要继续逃避吗?
 别人怎么说,我都不介意
 
 
 
 | 
 |