Использование mystem
Mystem — консольная программа. Ее следует запускать в терминале.
Программу можно использовать так:
Вызов
$ mystem [опции] [входной файл] [выходной файл]
В результате mystem будет читать ввод и записывать результат своей работы в указанные файлы. Если имена файлов опущены, или если вместо имени указано "-", то будет использоваться стандартный ввод/вывод, соответственно.
Примеры
$ mystem на входе - стандартный ввод, на выходе - стандартный вывод
$ mystem input на входе - файл input, на выходе - стандартный вывод
$ mystem - output на входе - стандартный ввод, на выходе - файл output
$ mystem input output на входе - файл input, на выходе - файл output
Стандартный ввод и вывод, естественно, можно тоже перенаправлять:
$ mystem <input>output
Опции
Опции надо указывать по правилам UNIX - до имен файлов, при этом можно склеивать, комбинировать, и т.д.
|
Построчный режим; каждое слово печатается на новой строке. |
|
Копировать весь ввод на вывод. То есть, не только слова, но и межсловные промежутки. Опция необходима для возврата к полному представлению текста. В случае построчного вывода (когда задана опция Пробел для большей видимости заменяется на подчеркивание. Символ Таким образом можно однозначно восстановить исходный текст. |
|
Печатать только словарные слова. |
|
Не печатать исходные словоформы, только леммы и граммемы. |
|
Печатать грамматическую информацию, расшифровка ниже. |
|
Склеивать информацию словоформ при одной лемме (только при включенной опции -i). |
|
Печатать маркер конца предложения (только при включенной опции -c). |
|
Кодировка ввода/вывода. Возможные варианты: cp866, cp1251, koi8-r, utf-8 (по умолчанию). |
|
Применить контекстное снятие омонимии. |
|
Печатать английские обозначения граммем. |
|
Строить разборы только с указанными граммемами. |
|
Использовать файл с пользовательским словарём. |
|
Формат вывода. Возможные варианты: |
|
Генерировать все возможные гипотезы для несловарных слов. |
|
Печатать бесконтекстную вероятность леммы. |