Образовательная галактика Intel®

Блог Участника

Запись блога

Работаем с текстом

Инструментов для визуализации данных существует великое множество. Среди них есть более простые и более сложные, работающие онлайн и устанавливаемые на компьютер, платные и бесплатные. У всех есть свои плюсы и минусы, специализация и спектр возможностей. Познакомимся с некоторыми инструментами, которые ориентированы на визуализацию текста.

О сервисах для создания различных облачных конструкций из слов и вариантах использования таких сервисов много писали в постах на Галактике.

1 Интересный сервис Many Eyes для визуализации и анализа пользовательских материалов.
На сервис можно загружать цитаты, цифры. Сервис распознаёт данные: текст; проценты; цифры. Затем визуализировать их - создавать словесные облака, схемы, диаграммы, карты, подвижные изображения (интерактивную визуализацию) – и тут же обсуждать их с другими пользователями. Это в некотором роде и социальный сервис. Для начала работы необходимо зарегистрироваться. Сервис поддерживает кириллицу.
Все загружаемые данные — становятся доступными для всех, что, возможно, приносит некоторые неудобства для пользователей, предпочитающих иметь к таким данным ограниченную доступность.

В 2013 году у сервиса появилась новая версия, которая предлагает без регистрации создавать визуализацию ваших данных.



Сервис после обработки материалов (а материалы для загрузки вы можете добавлять в виде текста или смешанных табличных данных) предлагает наилучшие варианты визуализации на основании тех данных, которые вы загрузили.

Среди инструментов сервиса три больших блока визуализаций:
1. Визуализация частей целого:
  • Heat-карты.
  • Пай-чарты.
  • Tree-maps.
  • Пузырьковая диаграмма.


2. Визуализация изменений во времени:
  • Диаграмма в столбиках.
  • Динамическая линейная диаграмма.
  • Баббл-чарт — диаграмма из кружков.
  • Блок-гистограмма.


3. Сравнение набора значений:
  • Облако слов.
  • Дерево из слов.
  • Сетевые диаграммы, для значений и для слов/фраз.


Для просмотра и построения диаграмм сервис предложит установить Java плагин. С этим плагином возникло неожиданно много сложностей. По умолчанию этот плагин блокируется и пришлось добиваться от компьютера начать работать с данными. О том, как включить Java в браузере рекомендации от Java.

Порядок работы с сервисом:
1. Вы выбираете свой оригинальный текст или используете готовый.
2. Грузите данные на сервис. Все тексты, включая данные из таблиц, переносятся на сервис через буфер обмена. Сервис распознает данные и предлагает отредактировать столбцы с данными (сменить тип данных) если по вашему мнению он распознал их неправильно.
3. Даете название, источник информации и описание.
4. Сервис предлагает построить визуализацию из предложенных типов. Здесь же, на этой страничке, можете просмотреть, как это выглядит.
5. Публикуете визуализацию.

Инструкция по работе с новой версией сервиса здесь.
Пример:



2. TagCrowd - сервис для создания облака тегов. Пригоден для анализа частоты употребления слов в тексте. Сервис бесплатен. Материал для построения облака берётся из обычного текста, URL страницы или загруженного файла. Готовое облако можно редактировать на любом этапе. Можно воспользоваться кодом для встраивания облака на странички ваших сайтов или блогов. Для начала работы не нужно регистрироваться. Сервис весьма прост в работе. Инструкция не требуется.
Можно настроить количество слов для визуализации (по умолчанию – 50), возможность преобразования слов написанных заглавными буквами. Ограничить минимальное повторение встречающихся в тексте слов (по умолчанию-1) и объединять в группы устойчивые словосочетания.

Ниже облако из стихотворения Роберта Фроста.




3. Сервис Wordle.net предназначен для генерации "облака слов" из текста, которые вы предоставляете сервису. Облако выделяет слова, которые чаще встречаются в исходном тексте. Вы можете настроить различные шрифты, макеты и цветовые схемы вашего облака.
Созданные изображения можно добавить сохранить в в Wordle альбом и добавить ссылку на свой сайт, блог или сохранить картинку на жесткий диск компьютера.

Видеоинструкция здесь.
Пример:



4. Сервис WordCloud делает из страницы любого сайта Облако слов, для этого нужно только ввести адрес сайта. Интерфейс на русском языке и не требуется регистрация. Готовое облако можно сохранить на свой компьютер с помощью контрменю. В настройках можно ограничить длину слова, фильтровать заглавные и выбрать цветовую схему.

Пример:



О визуализации можно почитать:

Комментарии

Активный пользователь

  • Группа: Пользователи
  • Сообщений: 942
  • Регистрация: 20.8.2012
  • Из: Нижний Тагил
  • Номер участника: 117773
Предупреждение

Всегда ценная информация от Александра Геннадьевича!


вот только у меня WordCloud капризничает: выдает по-английски sad.gif


--------------------
Вы полагаете, всё это будет ...

Активный пользователь

  • Группа: Пользователи
  • Сообщений: 839
  • Регистрация: 23.6.2014
  • Из: г. Гродно, Беларусь
  • Номер участника: 153704
Предупреждение

Цитата(Наталь_я @ 24.8.2014, 21:13)
вот только у меня WordCloud капризничает: выдает по-английски sad.gif

То есть вы вводите текст на русском, а компьютер выдает облако на английском? Странно, WordCloud поддерживает кириллицу.

Сообщение отредактировал grassom - 24.8.2014, 20:39

Активный пользователь

  • Группа: Эксперт портала
  • Сообщений: 674
  • Регистрация: 10.11.2010
  • Из: РМЭ, Йошкар-Ола
  • Номер участника: 93509
Предупреждение

Цитата(Наталь_я @ 24.8.2014, 21:13)
Всегда ценная информация от Александра Геннадьевича!


вот только у меня WordCloud капризничает: выдает по-английски sad.gif
Наталья Николаевна, такой вариант у меня получился только в случае, когда ввел адрес web-странички на которой был только английский текст.


--------------------
Удачи и всего самого доброго. Александр Геннадьевич Баданов http://badanovag.blogspot.com/

5 пользователей просматривает
5 гостей
0 участников
0 анонимных участников
Yandex Bot

Мои ссылки в блоге

Поиск в блоге


Наверх