项目理念

Jules Maigret 探长是由 Georges Simenon 创作的法国虚构警探。他的侦查方法建立在理解不同人物的性格,以及他们之间的相互关系之上。

一句话总结:用户名 => 档案

Maigret 的设计目标,是仅凭一个用户名,就尽可能收集关于此人的全部可获取信息。

具体包括哪些信息?一是指向此人各个账号的链接;二是一切可被机器抽取的字段,例如:其它用户名、真实姓名、头像 URL、生日、所在地(国家、城市等)、性别。

这些数据汇总起来构成一份档案,同时也方便其它工具进一步处理和分析。每一项数据都带有固定格式的标签(例如关注者数量为 follower_count,账号创建时间为 created_at),以便各类系统对其进行解析、分析,并存入数据库。

项目起源

Maigret 始于一次对 OSINT 调查人员实际使用工具的研究,以及由此得出的结论:许多流行工具并没有真正带来调查价值。这一观察的原始研究总结在文章 What's wrong with namecheckers 中。如需更全面地了解用户名检查类工具的全景,请参见整理好的 OSINT namecheckers list

由此衍生出两个想法:

  • socid-extractor —— 一个专注于从账号页面和公开 API 响应中抽取结构化身份数据(用户 ID、真实姓名、关联账号、个人简介、时间戳等)的库,让“找到账号”不再是流水线的终点。

  • Maigret 本身 —— 最初是 Sherlock 的 fork,但在覆盖范围、信息抽取深度和检查可靠性等方面早已远超原项目。如今,主流 OSINT 厂商已把 Maigret 作为组件集成进各自的商业产品中。