|
- 2018
Стохастическая роевая кластеризация в задачах автоматизированной обработки данных, представленных на естественном языке 158DOI: 10.17759/exppsy.2018110301 Keywords: обработка данных, представленных на естественном языке, комбинаторная оптимизация, оптимизация методом роя частиц, нелинейное снижение размерности Abstract: Рассматривается метод обработки данных, представленных на естественном языке, использующий стохастический алгоритм нелинейного снижения размерности многомерных данных, учитывающий дискриминирующую силу найденного решения для заданных значений категориальной переменной, связанной с каждым наблюдением. Для поиска характеристик, обеспечивающих наилучшее разделение наблюдений в смысле заданного функционала качества, предлагается использовать численную процедуру, основанную на методе оптимизации, известном как ?Метод роя частиц?. В основе оценки качества решения лежит чистота кластеров, полученных в найденном пространстве методом k-средних, либо с использованием самоорганизующихся карт Кохонена
|