УПРАВЛЕНИЕ БОЛЬШИМИ СИСТЕМАМИ
на главную написать письмо карта сайта


јвтор:  ¬ыхованец ¬.—., ƒу ÷., —акулин —.ј.
Ќазвание:  ќбзор алгоритмов фонетического кодировани€
¬ыпуск:  73
–убрика:  »нформационные технологии в управлении
√од:  2018
Ѕиблиографи€:  ¬ыхованец ¬.—., ƒу ÷., —акулин —.ј. ќбзор алгоритмов фонетического кодировани€ // ”правление большими системами. ¬ыпуск 73. ћ.: »ѕ” –јЌ, 2018. —.67-94. URL: https://doi.org/10.25728/ubs.2018.73.4
 лючевые слова:  алгоритм фонетического кодировани€, фонетическое рассто€ние, индексирование слов по звучанию
 лючевые слова (англ.):  phonetic encoding algorithms, phonetic distance, record linkage, indexing words by sound
јннотаци€:  ѕриведен обзор алгоритмов фонетического кодировани€, предназначенных дл€ определени€ схожести слов по звучанию (произношению). јлгоритмы фонетического кодировани€ разделены на алгоритмы дл€ сравнени€ слов и алгоритмы определени€ рассто€ни€ между словами. ќписаны алгоритмы сравнени€ слов SoundEx, NYSIIS, Daitch-Mokotoff, Metaphone, Polyphone и алгоритмы вычислени€ рассто€ни€ между словами Ћевенштейна, ƒжаро, на основе N-грамм. ƒл€ каждого алгоритма указаны его достоинства и недостатки, приводитс€ аналог алгоритма дл€ русского €зыка. ƒл€ устранени€ общих недостатков алгоритмов фонетического кодировани€ предложено использовать не последовательности букв слов, а последовательности их элементарных звуков.
јннотаци€ (англ.):  This paper gives an overview of the phonetic encoding algorithms, designed to determine the similarity of words in sound (pronunciation). Phonetic encoding algorithms are divided into algorithms for comparing words and algorithms for determining the distance between words. Word comparison algorithms such as SoundEx, NYSIIS, Daitch-Mokotoff, Metaphone, Polyphone and algorithms for determining the distance between words such as Levenshtein, Jaro, N-grams are described. For each algorithm, its advantages and disadvantages are indicated, an analogue of the algorithm for the Russian language is given. To eliminate the common shortcomings of phonetic encoding algorithms, it is proposed to use not the sequence of letters of words, but the sequence of their elementary sounds. In this case, word recognition, record linkage, indexing words by sounds are expected to improve.

¬ формате PDF
ќбсудить статью в »нтернет-конференции по проблемам управлени€

ѕросмотров: 722, загрузок: 299, за мес€ц: 15.

Ќазад

»ѕ” –јЌ © 2007. ¬се права защищены