Экспорт чата
Настольная версия телеграма позволяет экспортировать историю чата. Этот документ рассказывает, как это сделать и что с этим делать.
Как экспортировать
-
В настольной версии зайти в чат
-
Нажать на три точки сверху справа
-
Выбрать пункт
Export chat history
(в русской версии —Экспорт истории чата
. -
Там можно выбрать, что именно экспортировать и сколько. Текстовые сообщения будут экспортированы в любом случае.
-
Запустить, подождать. Если экспортировать только текст, то будет довольно бысто.
-
В указанном месте появится папка с экспортированными данными.
*.html
-файлы можно открывать в браузере и читать чат.
Что с этим можно делать?
Что угодно, уж. Например, можно скормить базу сообщений OPT и рассчитать хорошую раскладку.
Также можно построить чатботов, которые повторяют наше поведение.
Как получить только текст сообщений?
В *.html
много всякого есть, не только текст сообщений. Чтобы достать его, можно воспользоваться скриптом ../extractor.pl. Для его запуска требуется установленный Perl на компьютере. На дистрибутивах GNU+Linux он обычно предустановлен. Примеры ниже предполагают Unix окружение, на Windows будет по-другому. TODO: инструкция для Windows.
Достать текст из файла и напечатать результат:
perl extractor.pl имя_файла_сюда
Достать текст из файла и сохранить результат в другой файл:
perl extractor.pl имя_файла_сюда > имя_другого_файла_сюда
Посчитать 15 самых частых слов (цифру 15 в конце можно менять, если убрать часть head -n 15
то напечатает вообще все слова):
perl extractor.pl имя_файла_сюда | tr '[:space:]' '[\n*]' | grep -v "^\s*$" | sort | uniq -c | sort -bnr | head -n 15