如果用源码和编译后的结果训练语言模型,能否有利于逆向?
2024-01-13 阅读 10
是的,把源码和对应的编译结果一起用来训练,确实会有利于逆向,但不是万能的。这样能让模型学习编译器常见的变换和优化痕迹,理解高层结构与低层指令的对应关系,从而在反编译、恢复变量/函数名、推断类型和控制流等方面给出更有用的候选结果。限制是编译会丢失信息,不同编译器、优化级别和目标架构差异大,混淆或高度优化会严重干扰,而且模型可能产生错误或虚构的推断,仍需人工验证和传统逆向手段配合。
更新于 2026年01月02日