Учебные тексты для детей призваны решать противонаправленные задачи: дети должны хорошо понимать их, но в то же время такие тексты должны учить читателей новым словам. Кажется важным иметь возможность автоматически обнаруживать слова, которые могут быть незнакомы детям разных возрастов. Сложной задачей является определение слов, которые читатели воспринимают как знакомые и понятные, но на самом деле понимают неправильно. Мы предлагаем метрику коварности слов, которая вычисляется как произведение доли тех респондентов, которые помечают слово как знакомое, на долю тех из них, которые правильно определяют его значение. Мы провели серию экспериментов и обнаружили несколько коварных слов русского языка. Мы выделили несколько гипотетических механизмов появления таких слов, отражающих близость к другим, более распространённым языковым единицам: словам, морфемам и словообразовательным моделям. Следующая задача — научиться выявлять коварные слова на основе различных языковых факторов.
http://www.dialog-21.ru/media/5007/iomdinblplusmorozovda-125.pdf