В этой работе мы представляем систему распределенной кластеризации текстов на основе библиотеки с открытым исходным кодом Dask для распределенных вычислений. Система применялась для интеллектуального анализа образовательных данных, накопленных в системе «Электронное образование Республики Татарстан» с 2015 по 2020 годы. C помощью разработанной системы мы сгруппировали текстовые документы, описывающие планирование уроков, а также провели сравнительный анализ средних оценок студентов.