Цитата:
Сообщение от skif
Спасибо, Mendel. Как я понял, данной проверке на уникальность доверять особо не стОит. Провел эксперимент: прогнал слегка измененный текст (процентов на 10 не больше). Результат - "Копий текста не найдено". Может подскажете какие еще есть достойные анализаторы плагиата? Но все остальные функции здорово облегчают работу. Правда, пока не разобрался как работать с "Семантическим ядром". Не сочтите за труд в двух словах...
|
Сервис предназначен для поиска КОПИЙ а не оценки качества изменения текста.

Оценка степени уникальности имеет две проблемы - увеличение количества запросов к поисковику и увеличение "ложных срабатываний". Чем менее четкий поиск идет, тем больше возрастают данные издержки, причем возрастание идет нелинейно.
Истио практически никогда не выдает ложных копий, тогда как копискейп (как по мне один из самых лучших в своем роде) для многих текстов на популярные тематики имеет более половины ложных срабатываний.
Для нечеткого поиска могу посоветовать адвего-плагиатус и миратулз.
Ну и можете пользоваться нашим "случайным поиском" - десяток случайных проверок не показавших ни одной копии говорит о довольно неплохом качестве уникальности.
По семантическому ядру все просто - при анализе текста выдается два списка слов - слова без стоп-слов и со стоп-словами. Если вы добавите слова в поле "семантического ядра", то появится третий список - слова которые есть как в тексте так и в семантическом ядре.
Удобен для анализа только тех слов которые нам интересны, а также при большом количестве слов в тексте для того, чтобы выделить слова, которые достаточно редкие в тексте, и потому не попадающие в список самых популярных, но при этом важные для нас.