什么是可解释性
可解释性大致想法是理解模型为什么给出当前的预测结果. 但至少我目前没有看到可靠清晰的定义和广泛接受的 benchmark, 故不过多展开. 可以参考
- 要研究深度学习的可解释性, 应从哪几个方面着手? 李 rumor 的回答
- 深度学习的可解释性方向的研究是不是巨坑? ninghaoo 的回答, Akiko 的回答
- 神经网络的可解释性是我们的错觉吗
Side note: 有些地方还会区分 interpretability 和 explainability, 我觉得没什么实际意义.