ПН   25  МАР
В КАЛИНИНГРАДЕ СЕЙЧАС 17:00:30   В МОСКВЕ СЕЙЧАС 18:00:30   В ЕКАТЕРИНБУРГЕ СЕЙЧАС 20:00:30   ВО ВЛАДИВОСТОКЕ СЕЙЧАС 01:00:30
ГОД 2018
   ДОБРО ПОЖАЛОВАТЬ НА САЙТ ПРОЕКТА "В ПРЕДГОРЬЯХ СЕМАНТИКИ".НАСТОЯЩИЙ РЕСУРС ЯВЛЯЕТСЯ АВТОМАТИЗИРОВАННОЙ ПЛОЩАДКОЙ ДЛЯ СЕМАНТИЧЕСКОЙ ОБРАБОТКИ ТЕКСТОВ РАЗЛИЧНОЙ ТЕМАТИКИ.ПРИГЛАШАЕМ ЛИНГВИСТОВ, ПИСАТЕЛЕЙ, РЕДАКТОРОВ, ЮРИСТОВ, АНАЛИТИКОВ И ДРУГИХ ЗАИНТЕРЕСОВАННЫХ ЛИЦ ВОСПОЛЬЗОВАТЬСЯ УСЛУГАМИ ВЫСОКОТЕХНОЛОГИЧНОГО СЕРВИСА.С УВАЖЕНИЕМ, РАЗРАБОТЧИКИ.  

ДОБРО ПОЖАЛОВАТЬ на сайт проекта "В ПРЕДГОРЬЯХ СЕМАНТИКИ". Настоящий ресурс является автоматизированной площадкой для семантической обработки текстов различной тематики. Приглашаем лингвистов, писателей, редакторов, юристов, аналитиков и других заинтересованных лиц воспользоваться услугами высокотехнологичного сервиса. С уважением, РАЗРАБОТЧИКИ.

Презентуемый на данном ресурсе семантический парсер JHON [ˈʤeɪhɔn] является полноценной авторской реализацией способа извлечения смыслов из естественно-языковых текстов на русском языке, в основу которой положены четыре фундаментальных этапа обработки лингвистической информации: графематика, морфология, синтаксис, семантика. Качество разбора предопределяется объёмом морфо-семантического словаря, а также набором синтаксических правил, внедрённых в ядро семантического анализатора.
Предлагаемый Web-сервис предоставляет широкой аудитории пользователей возможность обработки текстовых материалов по выбору: морфо-синтаксический, аннотированный семантический и формальный семантический разбор. В результате обработки предоставляются три варианта отчёта. Доступ к разбору текстов и последующему просмотру результатов осуществляется из личного кабинета после персональной регистрации и авторизации на сайте. На период тестирования семантического парсера JHON данная услуга предоставляется бесплатно. С уважением, РАЗРАБОТЧИКИ.

Семантический анализатор неструктурированных текстовых данных (парсер JHON [ˈʤeɪhɔn]) представляет собой автономное программное решение, которое без какой-либо дополнительной настройки позволяет получать конечный результат. Это решение состоит из трёх последовательно и независимо исполняемых программных блоков (графематического, морфологического, синтаксического), в которых из текстовых данных извлекаются сырые данные для последующего их семантического анализа. Настоящий Web-сервис содержит в себе графический построитель, собирающий сырые данные в семантические конструкты. Благодаря встроенному в парсер морфо-семантическому словарю, поставляемому разработчиком парсера, семантический анализ производится программно. Отчёты семантического парсера содержат в себе извлечённые из входного текста сущности и автоматически обнаруженные связи между ними. В разных отчётах выходные данные содержат в себе синтаксические и семантические конструкты, а также сведения о семантическом дереве и инфокарты событий.

Семантический анализатор JHON предлагает продвинутую коллекцию выходных массивов структурированных данных для последующего инфологического анализа текста. На базе этих структурированных данных можно также создавать бизнес-решения «под ключ». В частности, на данный продукт рекомендуется обратить внимание разработчикам промышленных систем лингвистического анализа по следующим прикладным направлениям:

1. Построение поискового индекса к естественно-языковым неструктурированным данным.
2. Иерархическая кластеризация данных на семантических связях.
3. Построение на объектах наблюдения "горячей карты" событий.
4. Выявление источников уникальной информации.
5. Контентный анализ СМИ ― извлечение фактов, событий, данных.
6. Реферирование объёмных текстов.

Сборка распределённого семантического приложения может быть осуществлена по микросервисной архитектуре REST.

В рамках сотрудничества на рассмотрение принимаются задачи по лингвистическому анализу текстов. Возможные варианты сотрудничества:

1. Разработка семантического парсера непосредственно под Вашу лингвистическую задачу.
2. Разработка индивидуального отчёта к парсеру JHON [ˈʤeɪhɔn] с публичным доступом к нему на сайте DWORQ.COM.
3. Подготовка к выгрузке с сайта DWORQ.COM по микросервисной архитектуре (для распределённых приложений) интересующих Вас аналитических данных в формате JSON, вычисленных на базе результатов семантического парсинга.

Вопросы, касающиеся сотрудничества, обсуждаются Разработчиком на стороне Заказчика.

Первичное и все последующие обращения к Разработчику осуществляются со страницы "Контакты", доступной после авторизации.

В А Ж Н А Я    И Н Ф О Р М А Ц И Я 

Данный ресурс доступен 24 часа в сутки, при этом активность семантического парсера JHON (как и регистрация и авторизация) на время тестового периода ограничена и сервис предоставляется строго с 10:00 до 19:00 по московскому времени.

Непосредственный вход на страницы регистрации и авторизации осуществляется с ссылок, которые можно увидеть на колоннах титульной страницы при наведении на них курсора мыши. Все тонкости дальнейших последовательных действий прописаны на соответствующих страницах.

После авторизации пользователь автоматически переводится в ParsingRoom. Именно здесь можно приступить к главной задаче посещения данного ресурса – к семантическому разбору текстов. На время тестового периода разовый объём обрабатываемого парсером текста не должен превышать 1000 знаков. Данная услуга предоставляется бесплатно.

При вводе текста в соответствующее окно лишние знаки автоматически отсекаются. Далее выбирается тип разбора, после чего автоматически активируется кнопка "Отправить". После нажатия на активированную кнопку через секунду в окне браузера откроется новая вкладка с результатами того или иного разбора. Сохраняйте отчёты, если предполагаете обратиться к ним в дальнейшем. До ввода следующего текста необходимо очистить поле ввода от предыдущего.

История сеансов одномоментно фиксируется в соответствующих таблицах. При выходе из ParsingRoom она удаляется.

Если после отправки текста на разбор в браузере выпадет окно с информацией об ошибке, напишите разработчику непосредственно из кабинета и при этом не забудьте вставить в текст письма неразобранный парсером текстовый материал.

Обращаем внимание пользователей Web-сервиса на ресурс "СИЛЬНЫЕ РЕШЕНИЯ", заточенный под информационную площадку данного проекта. В настоящее время здесь опубликованы статьи, посвящённые текущему состоянию компьютерной лингвистики, а также анализу программных средств автоматической обработки текста, в том числе и представленного здесь семантического парсера JHON:
– "Сетевой обзор инструментов машинного анализа текста" и
– "Способ решения проблемы автоматизации процессов извлечения связей в информационном пространстве".

Любое обращение к Разработчику осуществляется из ParsingRoom, доступной после авторизации.


Обращаем внимание лингвистов на то, что семантический парсер JHON [ˈʤeɪhɔn] позволяет работать с большими и очень большими объёмами текстовых данных и позволяет извлекать из них всю информацию о содержащейся структуре семантических связей вокруг лексем в контексте того или иного понятия. Семантический парсер, как инструментарий, предлагается в качестве исследовательской платформы. Существенным моментом является возможность обратного разделения автоматически извлечённой семантической структуры на независимые друг от друга фрагменты вокруг определяемых лингвистом контекстов без потери присутствующих в исходном тексте смыслов. Кроме этого необходимо отметить возможность последующего проведения функционального анализа на базе выявленных на предыдущем шаге семантических конструктов. Такой анализ проводится под целевую установку исследования с последующей передачей его результатов специалистам в других предметных областях (технарям, психологам, IT-специалистам).

Если обратиться к отчёту "Аннотированный семантический разбор", сформированному на сервере в результате машинного разбора текста, то в нём можно найти полезную информацию по лексической статистике связей слов с различными частями речи. Для удобства работы с извлечёнными из текста сущностями в отчёте проведено их разделение на тематики по таким категориям, как "абстракция", "конкретика", "место", "субъект", "действие", "время", "вещество", "предмет", "числительное".
Ниже приведены две примерные выборки такой статистики для сущности "вода" из категории "вещество" и для сущности "аппарат" из категории "предмет". Исходным текстом послужили статьи, взятые из открытых источников: Выпарные аппараты и установки, Глубоководные обитаемые аппараты «Мир-1» и «Мир-2», Ирригация корневого канала. Техника и методы и Полезные свойства минеральной воды.


Авторам статей и иных печатных материалов рекомендуем воспользоваться "Морфо-синтаксическим разбором" исходных текстов, в результирующих отчётах которых Вы найдёте много полезной информации о морфологических признаках лексем, а также о синтаксических конструктах, присутствующих в исходных текстах. Так, например, в разделе "Морфология" данного отчёта показываются все омонимы отдельно взятых лексем. В других разделах демонстрируются различные виды придаточных оборотов. К сведению, из исходного текста извлекаются причастные, деепричастные и определительно-придаточные обороты. Их выделение демонстрирует частоту и плотность тех или иных придаточных оборотов, а также указывает на их связь с остальными частями и членами предложений. Приведённый ниже примерный фрагмент такого отчёта даёт общее представление о нём.

Редакторам, как специалистам, работающим с большими объёмами текстовых данных, рекомендуется обратить особое внимание на два из трёх семантических разбора, предлагаемых на данном Web-сервисе, а именно: "Формальный семантический разбор" и "Аннотированный семантический разбор". В отчёте "Формального семантического разбора" содержится выгрузка ведущих триплетов в узлах семантического дерева (подлежащее-сказуемое-дополнения) и вспомогательных триплетов на причастных оборотах, вкупе раскрывающих последовательность изложения исходного текстового материала. Кроме этого отчёт содержит в себе выгрузку определительных дуплетов, раскрывающих лексику автора текста, использованную в произведении при подаче образов субъектов, объектов, фактов и событий. Данные отчёты дают редактору важную информацию о насыщенности повествования дополнительными образами, а также их уместности в предмете описания. Ниже в качестве примера приведён фрагмент отчёта с триплетами и дуплетами на базе пропущенного через семантический парсер текстового материала (еженедельник «Литературная Россия»).
Помимо анализа образности и логичности редактируемого текста редакторская деятельность предполагает проведение стиллистического анализа текста и оценки степени содержательности повествования. В последних видах анализа редакторам может существенно помочь отчёт "Аннотированного семантического разбора". В разделе данного отчёта, а именно в "Инфокарте событий, разложенных по времени действия в понятийной системе координат" представлены инфодиаграммы событий, которые визуализируют описывающие события конструкты, состоящие из субъектов (сущностей в именительном падеже на вертикальной оси инфографика), объектов (сущностей в винительном падеже на горизонтальной оси инфографика) и действий (сказуемых, стоящих на диагонали в центре инфографика). По качеству отображенной информации из перечисленных данных можно судить о стиле изложения текста. Кроме обозначенных единиц, моделирующих события, под горизонтальной осью также располагаются сведения об обстоятельствах и дополнениях, раскрывающих нюансы, сопровождающие описанные в тексте события. По последним можно судить о наличии в тексте как незначащих, так и семантически содержательных данных. Большое количество незначащих данных сигналит о необходимости редакторской правки анализируемого текста. Примерный фрагмент отчёта с подобными сигналами представлен ниже на коротком абзаце из технического текста.

Юристам предоставляется инструмент машинной обработки текстов с целью извлечения из них смысловых конструктов. Разработчики данного Web-сервиса, понимая всю сложность задачи автоматизации интеллектуальной деятельности в общем и всю многофакторность проблемы интерпретации сложносвязанных логических цепочек в текстах юридического содержания в частном, предлагают юристам обратить внимание на предоставленную семантическим парсером JHON [ˈʤeɪhɔn] возможность извлечения опорных лингвистических данных и связей между ними. Для этих целей подходит "Аннотированный семантический разбор", в отчёте которого особое внимание уделено графическому представлению семантической информации. Например, в таблице "Ствол семантического дерева (ведущий триплет)" упомянутого отчёта в разделе "Семантические связи в отдельных группах членов предложения" можно почерпнуть исчерпывающую информацию о субъект-объектных отношениях. Для получения более полной картины об операционной деятельности, сопутствующей установленным субъект-объектным отношениям, следует воспользоваться таблицей "Ветвь семантического дерева с дополнениями" в том же разделе. Указанные две таблицы полностью покрывают все действия, сопутствующие предмету описания. Ниже представлен примерный фрагмент отчёта для пункта 9 статьи 21 Федерального закона от 05.04.2013 N 44-ФЗ "О контрактной системе в сфере закупок товаров, работ, услуг для обеспечения государственных и муниципальных нужд".
Одним из наиболее интересных способов графического представления семантической информации по мнению разработчиков является "Инфокарта событий", которая наглядно демонстрирует информацию о явлениях с причинно-следственными отношениями между действиями. На примере пункта 9 статьи 21 Федерального закона от 05.04.2013 N 44-ФЗ можно получить показательный отчёт, фрагмент которого представлен ниже.

На данном Web-сервисе предоставляется обработка текстовых материалов семантическим парсером JHON [ˈʤeɪhɔn]. Конкретно аналитикам рекомендуются два из трёх доступных вида разбора текстовых данных: "Морфо-синтаксический разбор" и "Аннотированный семантический разбор". Первый вид разбора завершается отчётом, основанным на цветовом выделении в тексте, например, именованных сущностей и числовых данных. Так, в разделе "Именные синтаксические группы" этого отчёта цветом выделены имена собственные и места описываемых событий (см. примерный фрагмент 1), а в разделе "Синтаксические группы с числительными" того же отчёта цветом выделены все обороты, связанные с числами, числительными и количественными данными (см. примерный фрагмент 2).
Следует обратить внимание на тот факт, что помимо указанных категорий данных цветовому выделению подвергнуты сказуемые, которые демонстрируют функциональную карту описанного в исходном тексте содержания. Кроме отдельных категорий данных несколько разделов отчёта посвящены семантическим связям, также выделенных цветом. К последним относятся "предложные группы с обстоятельствами и дополнениями", "конструкты на сущностях", "определительные синтаксические группы" и "ассоциативные конструкты". Более детально с результатами семантического парсинга можно ознакомиться из личного кабинета на примере любых текстовых данных.

Второй вид рекомедуемого аналитикам разбора ("Аннотированный семантический разбор") завершается отчётом, основанным на выгрузке распарсенных данных в отдельные таблицы. Так, в таблице "Ветвь семантического дерева с предложными определениями и ассоциативными дополнениями" в разделе "Семантические связи в отдельных группах членов предложения" можно получить все ассоциативные связи, присутствующие в исходном тексте. Из данной таблицы можно почерпнуть информацию о связях имён собственных с должностями физических лиц или с названиями юридических, государственных или общественных образований. В том же отчёте благодаря присутствию в нём синтаксических признаков лексем ("кто", "что делает", "где", "когда", "сколько" и т.п.) специалисты через них могут выйти на дополнительные структурированные сведения исходного текста. Ниже приведён примерный фрагмент отчёта с ассоциативными дополнениями.

РЕГИСТРАЦИЯ
АВТОРИЗАЦИЯ