пятница, 15 февраля 2019 г.

Глоссарий и обратный перевод


Глоссарий это один из простейших инструментов, который очень давно применяется авторами для облегчения читателям понимания смысла (семантики) в научном, инженерно-техническом или другом тексте (рис.1). При этом, включение глоссария в авторский текст не является обязательным условием. Также, нет единых стандартов на формат и структуру данных при составлении глоссария.

Аналогичными смысловыми понятиями являются – глоссарий, словарь, список терминов и сокращений. Глоссарий может быть структурно оформлен в отдельный раздел книги, документа, статьи или являться самостоятельным изданием, другим информационным объектом.

Рисунок 1. Глоссарий для понимания смысла и/или перевода

Глоссарий (лат. glossarium «собрание глосс») — словарь узкоспециализированных терминов в какой-либо отрасли знаний с толкованием, иногда переводом на другой язык, комментариями и примерами. «Собрание глосс» — это перечень иноязычных или непонятных слов в тексте книги с толкованием. Собственно, глоссарии являются предшественниками словаря [1].
Аббревиатура (лат. brevis «краткий») — слово, образованное сокращением слова или словосочетания и читаемое по алфавитному названию начальных букв или по начальным звукам слов, входящих в него [2].
Словарь — это книга или любой другой источник, информация в котором упорядочена c помощью разбивки на небольшие статьи, отсортированные по названию или тематике. Различают лингвистические, энциклопедические и терминологические словари [3] (рис.2).

Интуитивно понятно, что Глоссарии бывают полезны для работы с текстами, которые относятся к описанию самых разнообразных, особенно междисциплинарных видов человеческой деятельности. Например, без них сложно обойтись при работе с текстами, имеющими отношение к компьютерной индустрии, цифровой экономике, социально-техническим системам. Глоссарии используются для определения новых понятий и описания их смысла, для единообразного перевода текстов на другие языки (рис.4), для уменьшения нежелательных смысловых толкований. Вместе с тем, существуют любопытные примеры для оценки границ применимости Глоссария [4], ввиду его практической бесполезности.

Рисунок 2. Обобщенная классификация Глоссариев

Прежде чем использовать объекты, которые относятся к категории Глоссарий в своей целенаправленной деятельности, как правило, необходимо выполнить несколько предварительных шагов, позволяющих формализовать методы исследования данной темы. Такой подход, позволит понять логику в обосновании ответов на такие вопросы, как:

  • Сколько нужно сочинить и прочесть художественных произведений: романов, рассказов, стихов и прочее, чтобы понять душу человека? – Неизвестно.
  • Сколько нужно изучить книг, чтобы понять основы элементарной геометрии? – Один - два школьных учебника.
Таким образом следует отметить, что у ответов на эти вопросы нет прямого теоретического обоснования, а практическое – есть.

Правила составления Глоссария


Глоссарий состоит из статей. Статья содержит термин и тело описания. Тело описания — это определение термина.
При составлении статей принято соблюдать следующие рекомендации:

  • следует избегать употребления жаргонизмов;
  • содержание тела описания кратко раскрывает смысл термина;
  • следует стремиться к точности и достоверности информации.
Два главных правила построения Глоссария:

  1. Новое определение термина основано на ранее определенных терминах.
  2. Подстановка описания термина не должна менять смысла текста.

Возвращаясь к проблеме Глоссария, постараемся получить описание сути проблемы. В качестве содержательного иллюстративного примера воспользуемся описаниями понятия «равнобедренный треугольник». Казалось бы, что в этих фрагментах речь идет о сведениях из элементарной геометрии, но сложно оценить позитивность использования художественных образов для повышения степени понимания смысла. Излишняя двусмысленность и образность - это общая проблема для многих видов человеческой деятельности.

Рассказ о треугольниках

Жила - была на свете важная геометрическая фигура [5, 6]. Важность её признавалась всеми, ибо при изготовлении многих вещей её форма служила образцом. Любимая песенка этой чудо фигуры:
       «Меня знает каждый школьник,
         А зовусь я треугольник.
         У меня вершины три,
         И три ровных стороны».
Два мои угла при основании равны и боковые стороны одинаковые, подумала фигура и решила назвать себя равнобедренной. Скучно было фигуре одной и отправилась она искать друзей. Встречает как-то фигуру: стороны три и угла три. Вот только один угол прямой! Ура! Это прямоугольный треугольник! Стали они дружить. Вместе трудиться, вместе веселиться. Как–то нашли отрезок и решили поэкспериментировать: приложили его одним концом к вершине, а другим к середине противоположной стороны. Красота, это будет МЕДИАНА! Попробуем ещё и поделим угол пополам!
       «Все также скачет по углам
         Веселая, смешная крыса.
         Мы делим радость пополам,
         А делит угол БИССЕКТРИСА».
Вот так они проводили досуг. Однажды гуляя по лесу, встретили очень похожую парочку. Познакомились и стали вместе играть в сравнение. Прижался равнобедренный треугольник к похожему на себя и все точки совпали. Ура! Мы одинаковые. Думали они о равенстве, думали и придумали три теоремы:

  1. если две стороны и угол между ними одного треугольника соответственно равны двум сторонам и углу между ними другого треугольника, то треугольники равны;
  2. если сторона и два прилежащих к ней угла одного треугольника равны соответственно стороне и двум прилежащим к ней углам другого треугольника, то треугольники равны;
  3. если три стороны одного треугольника равны соответственно трем сторонам другого треугольника, то треугольники равны.
С тех пор друзья много времени проводят вместе и встречают новых.

История одного треугольника

Жил да был равнобедренный треугольник [7]. Собрался он однажды пойти на новогодний бал, а наряда у него нет, и решил он сделать себе накидку. А как найти место присоединения накидки к вершине треугольника - не знает. Обратился он к своим друзьям: квадрату, параллелограмму, ромбу, окружности. Думали они, думали и ничего придумать не могут. А праздник уже на носу.
Вдруг неизвестно откуда появилась биссектриса. «Что приуныли, друзья?» - крикнула она. Они поделились с ней своим горем. Биссектриса пропела: «Разве это горе? Ты треугольник равнобедренный, а значит, боковые стороны равны. Сложи накидку пополам и увидишь середину, которую нужно одеть на вершину». Вот и сказке конец, а кто учит геометрию - молодец!

Метод обратного перевода


Современное состояние методов обработки больших данных, теории и практики машинного перевода и других технологий обработки информации позволяет использовать эти методы для проведения экспериментов, которые позволяют сформулировать предположения и сделать выводы по поводу применения глоссариев (рис.3).



Рисунок 3. Базовые методы машинного перевода

Воспользуемся технологическим приемом «метод обратного перевода» в оценке применения глоссариев [8] для фрагмента «История одного треугольника». В качестве инструмента используем сервис Google Translate.


В определении метода обратного перевода, для краткости, воспользуемся следующей нотацией:
TRU(0) – исходная или «нулевая» версия текста на русском языке,
Tr: TRU(0) ® TEN(1) – операция машинного перевода (МП) текста TRU(0) на русском языке в текст TEN(1) на английском языке.
Тогда метод обратного перевода - это последовательное выполнение двух операций МП:

( Tr: TRU(0) ® TEN(1) , Tr: TEN(1) ® TRU(1) )

Под параметром стабилизации содержимого текста относительно метода обратного перевода будем понимать следующее.
Текст TRU(0) стабилизируется, если существует такое i > 0, что TRU(i-1) ~= TRU(i)  . При этом, минимальное значение i - назовем параметром стабилизации.

Операция равенства двух текстов, обозначенная как «~=», понимается без сохранения специальных символов и других символов форматирования, которые не обрабатываются системой МП.

Для современных систем МП имеет место (рис. 3):

( Tr: TRU(0) ® TEN(1) ) ~= ( Tr: TRU(0) ® TML , Tr: TML ® TEN(1) )
где TML - промежуточное значение переводимого текста на внутреннем «мета-языке». К сожалению, операция «псевдо-перевода»

( Tr: TRU(0) ® TRU(1) ) ~= ( Tr: TRU(0) ® TML , Tr: TML ® TRU(1) )
обычно системами МП не поддерживается.




Рисунок 4. Использование Глоссариев для машинного перевода.

Текст содержимого фрагмента «История одного треугольника» стабилизируется только после пяти циклов обратного перевода.
***   ***   ***
Был равнобедренный треугольник. Однажды он собирался пойти на новогодний бал, но у него не было платья, и он решил сделать плащ для себя. И он не знает, как найти место, где мыс прикреплен к вершине треугольника. Он повернулся к своим друзьям: квадрат, параллелограмм, ромб, круг. Они думали, думали и не могли думать ни о чем. И праздник приближается.
Внезапно появился неизвестный биссектриса. «Что тебе грустно, друзья?» - крикнула она. Они поделились своим горем с ней. Бисектор пел: «Это горе? Вы равнобедренный треугольник, что означает, что стороны равны. Сложите плащ пополам и посмотрите на середину, которую хотите надеть. Сказка окончена, но тот, кто преподает геометрию, хорош!
***   ***   ***

Мы не будем обращать внимание на грамматические ошибки. В тексте отмечены только места содержащие смысловые (или семантические) ошибки:
-       появились два понятия, которых не было в исходном тексте – это «мыс» и «бисектор»;
-       появились три логические ошибки – это «не могли думать», «стороны равны» и «преподает».

Машинный перевод исказил смысл текста, но позволил определить в нем те места, которые требуют обязательного перефразирования.

Если машинный перевод – это перевод часто плохого качества и с ошибками, то для обхода этих недостатков на практике используется так называемые «КОШКИ» - специализированные человеко-машинные системы и технологии [9]. «КОШКИ», они же CAT-tools (Computer-Assisted Translation tool, рис.5), - это Фреймворки (платформы) с возможностью встраивания сервисов Google translate или других сервисов машинного перевода. Облачные платформы CAT-tools существенно облегчают людям выполнять перевод качественно, быстро и с адаптацией к необходимым предметным областям.
Одновременное применение Глоссариев, использующих специфику предметной области, отраслевые и корпоративные особенности, является ключевым инструментом для параметризации процесса перевода с целью улучшения качества и снижения количества ошибок. Глоссарий в CAT-tools играет роль «памяти перевода».


Рисунок 5. Пример пользовательского интерфейса для CAT-tool

Следует отметить, что CAT-tools изначально не были предназначены для метода обратного перевода и, соответственно, связанные с этим методом практические задачи не исследованы и не реализованы.


Глоссарий – постановка задачи


В различных приложениях часто возникают такие задачи, где во времени меняется сама структура системы [10]. Приведем несколько примеров таких задач:
1.      Административная структура организации, система военной субординации.
2.      Организация систем связи, системы снабжения складов и баз.
3.      Построение номенклатуры товаров или изделий определенной категории (частично).
4.      Организация ассоциативной памяти в компьютере.
5.      Феодальная структура географического района.
6.      Организация систем глоссариев и словарей.

Большинство этих примеров относится к иерархическим структурам, графам и, соответственно, их определенной разновидности – к деревьям. Каждое из перечисленных приложений имеет свои особенности, которые приводят к постановке специфических задач и специальных методов их решения. Добавление в этот перечень задачи «Организация систем глоссариев и словарей», естественно после соответствующего обоснования, позволит перенести на нее многие практические результаты из этих смежных областей.

Выводы


Несмотря на тот факт, что Глоссарий относится к одной из многих слабо формализуемых понятийных категорий, Глоссарию соответствует структура данных – конечная иерархия (математическое доказательство этого факта будет приведено позднее). Это позволяет поставить и решить достаточно полезные практические задачи.

Категория Глоссарий имеет практическую целесообразность в силу интуитивной простоты своего применения, несмотря на сложности при проведении строгой формализации в её описании. Поскольку большинство недостатков Глоссария и, соответственно, методов составления глоссария, учтено при разработке относительно новой концепции «Онтология прикладной области», то нет особой актуальности в исследованиях в области методов их составления и использования.

Глоссарий предназначен для упрощения понимания смысла текста, за счет формирования семантических связей между используемыми ключевыми понятиями. Однако сам глоссарий не содержит требований и средств для формального представления этих структурных связей. В этом контексте можно говорить о том, что глоссарий является симулякром [11] онтологии. Такой способ подмены понятий довольно часто применяется в теории менеджмента и теории методологий.

Другой похожий пример использования симулякров — это понятие «дорожная карта», которое является симулякром «плана работ». На практике это означает, что может быть разработана презентация «плана работ», каковой является «дорожная карта», но нет собственно «плана работ», в котором взаимоувязаны все необходимые сущности и артефакты проекта или «портфеля проектов».

Литература и полезные ссылки

[4]  О смысле бессмысленного в формальной логике ("Джабберуоки", Бармаглот)   https://bourabai.ru/dm/logic/txt06.htm
[5] Рассказ о треугольниках https://refdb.ru/look/2008010.html
[6] Новелла о треугольнике https://refdb.ru/look/2432058.html
[7] История одного треугольника (ученица 7 класса Шевцова Мария)
[8] Чарычанская И.В., «Обратный перевод как инструмент сравнения и анализа текстов оригинала и перевода», 2003, https://cyberleninka.ru/article/n/obratnyy-perevod-kak-instrument-sravneniya-i-analiza-tekstov-originala-i-perevoda-1
[9] «Топ-10 программ памяти переводов» https://translationrating.ru/top-10-cat-tools-2017/

[10] «Динамический подход к анализу структур, описываемых графами», 1977,  http://www.mathnet.ru/php/archive.phtml?wshow=paper&jrnid=at&paperid=7406&option_lang=rus
[11] Симулякр https://ru.wikipedia.org/wiki/Симулякр


вторник, 11 декабря 2018 г.

Архитектура предприятия: человеческий фактор


Говорят, что современный бизнес содержит два ключевых фактора - инновации и маркетинг. Инновации часто упрощенно приравнивают к технологиям, а маркетинг - к цифровым коммуникациям. Таким образом, успех в бизнесе становится погоней за цифровыми возможностями и новейшими технологиями, которые позволяют их использовать. И все же… новейшие технологии продолжают доставлять проблемы, создавать головные боли и не всегда дают предприятиям преимущество, которое им необходимо для конкуренции, несмотря на огромные денежные затраты. Как это может быть?

Симулякры или модные словечки


Реальность такова, что компании гоняются за неправильными модными словечками, покупают неправильные решения, решают неправильные проблемы. Это проблему можно переформулировать и решить с точки зрения архитектуры предприятия. Для новичков, непредубежденных старожилов и практикующих корпоративных архитекторов (EA) при проектировании предприятия нужно задать фундаментальный вопрос: «Какую бизнес-проблему мы пытаемся решить?» [1].
Когда EA обращают пристальное внимание на этот фундаментальный вопрос, то они признают, что бизнес-проблемы нередко решаются с помощью нового инструмента. То есть, только технология не является решением проблемы. Они замечают, что самый эффективный процесс цифровизации, ставший в мире популярным благодаря самым ярким модным словам в отрасли, также недостаточен для ответа на фундаментальный вопрос. Другими словами, только процессы не являются решением проблемы.

Бизнес решает неправильные проблемы


«Магический треугольник» из людей, процессов и технологий был основой для решения бизнес-задач на протяжении десятилетий (рис.1). Целые структуры и методологии выросли вокруг простой концепции [2], заключающейся в том, что правильное и функциональное взаимодействие каждой из этих трех областей обеспечит бесперебойную работу бизнеса и согласованность бизнеса между предприятиями.
Миллиарды долларов были потрачены на людей в индустрии управленческого консалтинга, которые «овладели» искусством выравнивания «углов треугольника» и предложили окончательные решения самых больших и самых нелегких бизнес-задач. И все же ... компании продолжают сталкиваться с такими же известными и, казалось бы, хорошо решенными проблемами, раз за разом тратя огромные суммы на их решение [3]. Как это может быть?

Искусство выравнивания «углов треугольника» состоит в процедуре формулирования функциональных требований в виде наборов показателей, статических или более сложных - динамических. Эти показатели используются в качестве системы ограничений при нахождении решений бизнес-задач.
Рис.1. «Магический треугольник» или цифровая экосистема.

Корень проблемы


Люди являются корнем и ядром бизнеса, наиболее сложной частью предприятия, как социо- технической системы. Они определяют, выбирают, применяют процессы и управляют технологией. Только осознавая, что решение бизнес-задач требует решения проблем с людьми (и вызванных ими), мы сможем приблизиться к правильным решениям [4]. Правильные люди, правильные вопросы, правильные решения, правильный бизнес - это желанный результат деятельности практикующего ЕА в компании.

Примеры, практики и обоснование


    1.     Крис Локхарт. “The People Problem: A Primer on Architecting the Enterprise as an Enterprise Architect”. https://www.amazon.co.uk/People-Problem-Architecting-Enterprise-Architect/dp/154391490X/ref=asap_bc?ie=UTF8

Книга «The People Problem» призвана помочь ориентироваться в области архитектуры предприятия и в решении сложных бизнес-задач, особенно в эпоху быстрых деловых и технологических изменений. Опираясь на более чем 17-летний опыт консультирования крупных и малых компаний, входящих в список Fortune 500 и для местных стартапов, собран набор накопленных знаний, представленных в легко узнаваемых примерах.


        2.    «Enabling Distributed Security in Cyberspace» https://www.dhs.gov/xlibrary/assets/nppd-cyber-ecosystem-white-paper-03-23-2011.pdf


В документе «Создание здоровой и устойчивой кибер экосистемы с автоматизированным коллективным действием» (Building a Healthy and Resilient Cyber Ecosystem) приведено определение понятия «Кибер Экосистема» и описано системное применение этого понятия для модельного описания некоторой предметной области. При этом, собственно, «системное применение понятия» базируется на признании изоморфизма законов, управляющих функционированием используемых системных объектов.

        3.     «Управление ИБ в технологической Компании». https://sec2017.blogspot.com/2018/11/blog-post_22.html

«Пост» о построении и эксплуатации подсистемы информационной безопасности (ИБ) по модели жизненного цикла, как о неотделяемом компоненте в системе предприятия. Оказывается, что ландшафт «магического треугольника» подсистемы ИБ шире системы предприятия. Специалист ИБ нанимается на работу без точной уверенности о том, что он будет делать - эксплуатировать систему ИБ, и/или создавать ее, и/или решать задачу «выравнивания углов». Как это может быть?

           4.    "Путь к сети цифровых бизнес экосистем, содействие развитию на местном уровне". (“Towards a Network of Digital Business Ecosystems Fostering the Local Development“) http://www.digital-ecosystems.org/refs/2002_dbe_discussionpaper.pdf

Документ, содержащий толкование понятия «цифровая экосистема» в приложении к индустрии информационно-коммуникационных технологий (ИKT).

Цифровая экосистема является цифровой инфраструктурой, которая направлена на создание цифровой среды для организаций и поддерживающей сотрудничество, обмен знаний, развитие открытых, адаптивных технологий и эволюционных моделей бизнеса.

Цифровой экосистемный подход переносит концепции природных экосистем в цифровой мир, воспроизводя желательные механизмы дифференциации, развития продуктов и услуг, адаптации к конкретным местным потребностям.

четверг, 22 ноября 2018 г.

Управление ИБ в технологической Компании


Для упрощения изложения, под «применением» будем подразумевать стандартную модель жизненного цикла систем (потенциально, покупных систем) [1]. Можно выделить следующие направления деятельности службы информационной безопасности внутри Компании:
  • Организационно-методологическая деятельность.
  • Применение информационно-коммуникационных активов IT.
  • Применение специализированных информационно-технологических средств ИБ.
  • Применение инженерно-технических систем безопасности.
  • Применение методов «Белой шляпы».

Эти направления деятельности различаются по базовым моделям управления и, соответственно, методам управления, подразумевают владение различными компетенциями в соответствующих предметных областях. Каждое из этих направлений деятельности характеризуется большими объемами нормативно-справочной информации, имеет высокий уровень сложности и свою специфику для Компании.

Традиционно, к зоне ответственности службы ИБ Компании относится только одно из перечисленных направлений деятельности - по применению специализированных средств ИБ. Это связано с небольшими ресурсами, выделяемыми в Компании на ИБ. «Непрофильные для ИБ» направления деятельности выполняются совместно, с привлечением «профильных специалистов» Компании, в директивно задаваемые временные периоды.

Затраты Компании на ИБ обычно формируются на основе:
  • предложений от службы ИБ;
  • оценки фактических потерь бизнеса в результате инцидентов по линии информационной безопасности;
  • оценки возможных последствий от нарушения требований регуляторных органов.

Конструктивные выводы:

1.     Система информационной безопасности Компании является по факту социотехнической системой и выполняет важную корпоративную функцию, которую сложно спроектировать и построить в отсутствие корпоративных архитектурных решений.
2.     При построении архитектуры системы информационной безопасности Компании для оценки текущего уровня безопасности, рекомендуется учитывать:
  • отраслевые и международные стандарты по ИБ и проведению работ;
  • принцип «слабого звена»;
  • оценки времени обнаружения атаки;
  • график восстановления;
  • наличие информации для анализа уязвимости в инциденте и последующей защиты.

Негативные выводы:

Находясь на «стороне Добра» не следует заниматься подготовкой и пропагандой информационных материалов для «темной стороны».


среда, 7 ноября 2018 г.

О механизмах управления в цифровой экономике



Создание цифровой экономики в России имеет свою многолетнюю историю, глубокие исторические корни. Давно написаны достойные научные монографии на эту тему, прочитаны учебные курсы, подготовлены сотни высококвалифицированных специалистов. Например, давно сформулированы и решены многие задачи цифрового управления в экономике. Разработанные теоретические основы позволяют осуществить обобщение научно обоснованных результатов на решение большинства практических задач.

Перечитывая один из таких учебников по ЦЭ - «Механизмы управления», поймал себя на мысли о существовании пропасти, которая разделяет формальные постановки задач и уровнем современных документов по теме ЦЭ. Пропасть может быть преодолена добавлением в научно-методологические тексты «симулякров», таких понятий философии постмодернизма. Практически, это выражается в использовании таких слов и акронимов, как - цифровизация, диджитализация, ИИ, ИКТ, ИТ, ИБ к месту и не к месту. Обычно, эти симулякры ничего не означают, а в контексте описания за ними ничего нет, но частое их использование обеспечивает психологическое равновесие читателя в незнакомых вопросах.



Ознакомиться с электронной версией книги «Механизмы управления» можно по прилагаемой ссылке. Чтобы при прочтении быть более уверенным в себе экспертом по ЦЭ, мысленно добавляйте перед словом "механизм" прилагательное "цифровой".

вторник, 16 октября 2018 г.

Этика: средство цифровизации Хаоса общения


Информационные технологии так изменили нашу жизнь, в части процессов и механизмов общения, что было трудно предугадать и представить [1]. Тем не менее, системный подход к анализу этой проблемы позволяет выработать конструктивные пути для предложения к выбору рациональных моделей поведения.

Научное обоснование применения базовых положений этики для процессов научного исследования приведено в монографии российских ученых «Методология научного исследования» [2]. Опуская подробности следует отметить, что эти рассуждения базируются на этимологии понятий эстетика - этика – этикет:
·         Эстетика - философское учение о сущности и формах прекрасного в творчестве, в природе и в жизни, об искусстве как особой форме общественного сознания. Несомненно, что математика в значительной степени относится к искусству.
·         Этика - философская дисциплина, предметами исследования которой являются мораль и нравственность.  В науке под этикой понимают область знания, а под моралью или нравственностью — то, что она изучает.
·         Этикет - правила поведения людей в обществе, поддерживающие представления данного общества о подобающем.
Таким образом, этикет – это утилитарное воплощение принципов и понятий, имеющих глубокие философские основания. Слово «этикет» в заголовках публикаций в интернете часто заменяется словом «этика».

Этикет демократического общения

Первым наиболее подробным изложением этикета демократического общения стали «Правила регламента Роберта» [3]. Эта книга, написанная в США в 1876 году Генри Мартином Робертом, стала первым регламентным сборником, предназначенным для широкой публики. Вплоть до сегодняшнего дня это самый популярный в США свод правил регламента, используемый для проведения собраний в тысячах общественных, религиозных и других организаций.

Этикет сетевого общения

Попытки составления некого общего сетевого свода правил поведения в Интернете предпринимались не раз. В 1995 г. было выпущено рабочее предложение RFC 1855, содержащего стандарты, рекомендуемые в Интернете [4]. Наиболее известные своды правил предложены Тимом О'Рейли и Джимми Уэллсом, автором термина Web 2.0 и создателем свободной энциклопедии Wikipedia соответственно:
  1.   Мы берем на себя ответственность за наши собственные слова и за комментарии, которые мы разрешаем оставлять в нашем блоге... мы не будем размещать непозволительные материалы и будем удалять содержащие их комментарии.
  2.   Мы не скажем нашему сетевому собеседнику того, чего не осмелились бы сказать ему при личной встрече.
  3.   Если дискуссия станет слишком напряженной, мы попробуем поговорить с собеседником в частном порядке перед тем, как ответить публично.
  4.   Если нам покажется, что кого-то обидели, мы примем меры.
  5.   Мы не разрешаем анонимных комментариев.
  6.   Мы игнорируем онлайн-провокаторов.

Этикет научных дискуссий

Этические нормы научного сообщества были описаны Р. Мертоном в 1942г. как совокупность четырех основных ценностей [2]:
  •       демократический универсализм;
  •       общее достояние научного знания;
  •       бескорыстность и беспристрастность;
  •       рациональный скептицизм.

Как следствие этих принципов могут быть сформулированы 5 правил:
  1.       Каждый участник обсуждения имеет право на свое мнение, имеет право его высказывать и отстаивать. Любое подавление дискуссии категорически запрещается. В науке проблемы не решаются большинством голосов.
  2.       В одно время может говорить только один человек. Его ни в коем случае не перебивают, дают высказаться до конца.
  3.       Выступающему может быть задан любой вопрос, но только о том, что делалось лично им и только в таких формах как «правильно ли я понял...», «поясните, пожалуйста ...».
  4.       В выступлениях обсуждается только то, что сделано докладчиком, а не то, что сделал бы выступающий, будь он на месте докладчика. У каждого участника свое место, и каждый свою проблему понимает по-своему. Следует ценить то, что сделано, а не то, что хотелось сделать кому-либо другому.
  5.       Руководитель обсуждения в тактичной форме направляет дискуссию в русло повестки дня, не давая отвлекаться участникам на другие темы. В конце обсуждения его руководитель должен обобщить и кратко сформулировать итоги обсуждения.

Хаос общения в информационном пространстве


Хаос общения в информационном пространстве можно оценить через число нарушений положений Этикета, содержащего свод правил. Рост энтропии мешает достижению позитивных этических целей участников информационного общения.

Литература:

[1] Белов М.В., Новиков Д.А. Методология комплексной деятельности. http://www.mtas.ru/search/search_results.php?publication_id=21658
[2] Новиков А.М., Новиков Д.А. Методология научного исследования. http://www.mtas.ru/search/search_results.php?publication_id=17842
[3] Robert’s Rules of Order Newly Revised. #RONR http://www.rulesonline.com/
[4] RFC 1855: Netiquette Guidelines. https://www.ietf.org/rfc/rfc1855.txt

понедельник, 19 февраля 2018 г.

Онтология в проекте (for Dummies)


В компьютерной индустрии понятие Онтология лишь созвучно с аналогичным термином в философии - науке о бытии и познании. В инженерных областях деятельности «Онтология – это артефакт, структура, описывающая элементы некоторой системы». Чтобы не путать эти понятия и не вносить дополнительного повода для дискуссий, под словом Онтология в компьютерной индустрии или инженерии знаний подразумевается описание мета данных, либо используются термины "Онтология предметной области» или "Онтология прикладной системы".
«Онтология - термин, заимствованный из философии. Веб-онтология может включать описания классов, свойств и их экземпляры. Формальная семантика OWL описывает, как получить логические следствия. Онтология позволяет получить факты, которые не представлены в онтологии буквально, но следуют из ее семантики. Эти следствия могут быть основаны на одном документе или множестве распределенных документов, которые комбинируются с использованием определенных механизмов OWL». OWL – Web Ontology Language (https://www.w3.org/standards/semanticweb/).

Комментарий:
Артефакт, Структура, Элементы системы, Мета данные, Классы, Семантика – эти понятия используются в том смысле, как это принято в методологии объектно-ориентированного проектирования и разработки.
В составе рекомендаций Консорциума W3C.org разработаны и опубликованы наиболее существенные сведения об Интернете. Например - HTTP, CSS, XML, OWL это одни из них.

Рис.1.  Место Онтологии в проекте ИТ


Популистский взгляд на Онтологию в проекте

В первом приближении можно подразумевать, что Онтология - это «словарь». Всем известен пример энциклопедического «словаря» - https://ru.wikipedia.org/, зачем нужен другой? Интересный вопрос.

Ответ заключается в том, что Онтология - это необычный словарь. В том случае, когда важно или ценно организовать данные так, чтобы было можно обогатить данные смысловым значением для возможного применения процедур искусственного интеллекта - используют OWL для создания "словаря" или Онтологии и SKOS для разработки систем организации знаний или тезаурусов. В общем виде Онтология прикладной области это структурированный набор элементов четырех категорий:
·        классы или понятия;
·        связи или отношения;
·        аксиомы;
·        экземпляры или представители.

Можно представлять Онтологию прикладной области в виде совокупности элементов, объединенных в виде:
·        глоссарий;
·        тезаурус или таксономия с терминами;
·        понятийная структура;
·        аксиоматизированная теория.

К сожалению, для специалистов - гуманитариев востребованность содержательной интерпретации в деятельности по созданию Онтологии прикладной области очень быстро заканчивается.

Инструменты описания семантической сети

Для инженерии знаний в почете логика и формализм. Короче, необходимо владеть пониманием и навыками практического применения компонент «пирамиды семантического описания» для создания Онтологии проекта ИТ. Необходимо отметить, что для облегчения жизни архитекторов ИТ в технической составляющей этой деятельности существует Protégé.

Рис.2.  Пирамида семантического описания

К счастью, не для всех проектов ИТ необходимо создавать Онтологии. К сожалению, для проектов в цифровой экономике (ЦЭ) Онтологии создавать необходимо. При этом, необходимо создавать строго формализованные Онтологии, которые в первую очередь сможет понимать не только человек. 

Если Вы создаете Онтологии не в OWL 2, то у Вас "не правильный мед" и для семантических сетей Вы не правильный Онтолог. Описания Онтологий прикладных систем нужны в "публичном доступе". Иначе, кто будет участвовать в реализации проектов ЦЭ? Ответ - очевиден. Почему такой жесткий критерий "отсева"? Ответ пока такой - нельзя опубликовать любой текст в Интернете без его представления в HTML/XML. 

Примерами успешного применения Онтологий в области биологии и, одновременно, его драйвером является международный проект расшифровки генома человека. Не обходятся без построения Онтологий в проектах освоения космоса и в других высоко технологичных проектах.

В настоящее время создание Онтологий для прикладных областей возможно либо аналитическим путем или "вручную", либо в частично автоматизируемом процессе с применением технологий Big Data и AI, но это другая отдельная тема.