Инженерный вестник Дона

Разработка сервиса для генерации словоформ в корпусной лингвистике
- Аннотация
- pdf
Предмет исследований – разработка сервиса для генерации различных форм заданного слова, исходя из анализа слов, найденных в словаре. Были изучены имеющиеся подходы к решению такой задачи и выбран наиболее релевантный. Сервис осуществляет поиск внутри файла словаря с текстовым содержимым с целью автоматизации процесса выделения нужных слов среди всего множества. Выполняется поиск основы слова, учитывающий морфологию. Выполняя морфологический разбор слова, находится общая для всех его грамматических форм основа, отсекая суффиксы и окончания. В результате алгоритм работы сервиса позволяет искать все формы слова по заданному ключевому слову, учитывая словоформы. При этом также анализируется к какой части речи относится слово, это позволяет задавать разные методики определения словоформ. Для каждого типа слова: глагол, существительное, прилагательное, наречие, используется свой алгоритм для выделения словоформ. Особенность сервиса в том, что он позволяет не только искать словоформы по словарю, но и позволяет генерировать наборы словоформ, исходя из типа заданного слова. Сервис функционирует на платформе Linux под управле-нием веб-сервера Apache. Для разработки использованы бесплатные программные инструменты. Разработка велась на языках JavaScript, HTML и CSS, так же использовался серверный язык программирования PHP7.

Ключевые слова: поисковая система, анализ документов, лингвистика, словоформы, морфология, генерация слов, веб-сервис

05.13.18 - Математическое моделирование, численные методы и комплексы программ
Разработка веб-сервиса для поиска файлов по ключевым словам
- Аннотация
- pdf
Предмет исследований – разработка сервиса для поиска по файлам пользователя по заданному набору ключевых слов с параметрами. Были изучены имеющиеся подходы к решению такой задачи и выбран наиболее релевантный. Сервис осуществляет поиск внутри файлов с текстовым содержимым с целью автоматизации процесса выделения нужных файлов среди всего множества. В основе его работы лежит алгоритм Портера и используется подход стемминга текста с целью получения более точных результатов. Выполняется поиск основы слова, учитывающий морфологию. Выполняя морфологический разбор слова, находится общая для всех его грамматических форм основа, отсекая суффиксы и окончания. В результате алгоритм работы сервиса позволяет искать не просто по заданным ключевым словам, но и учитывает их словоформы, а также ищет сразу по нескольким наборам ключевых слов, каждый набор анализируется отдельно. Помимо этого можно задавать диапазоны числовых значений для поиска. Особенность сервиса в том, что наборы ключевых слов ищутся совместно в ближних абзацах в интервале окрестности от -20 до +20 слов друг от друга, учитывая таким образом контекст их появления в тексте. Сервис ранжирует найденные документы по качеству соответствия критериям поиска. Обрабатываются файлы в основных форматах: doc, xls, pdf, txt. Сервис функционирует на платформе Linux под управлением веб-сервера Apache. Для разработки использованы бесплатные программные инструменты.

Ключевые слова: поисковая система, анализ документов, стемминг, алгоритм Портера, словоформы, морфология, среднее-арифметическое процентов, веб-сервис

05.13.06 - Автоматизация и управление технологическими процессами и производствами (по отраслям) , 05.13.18 - Математическое моделирование, численные методы и комплексы программ
Оценка энтропии фрагментов рентгеновских изображений легких
- Аннотация
- pdf
Предмет исследования – медицинские флюорографические рентгеновские снимки грудной клетки. Обученная глубокая сверточная нейросеть осуществляет бинарную классификацию снимков и может быть использована в качестве помощника врача-рентгенолога. Для этого необходимо минимизировать ошибки первого и второго рода. Возможный подход к повышению эффективности применения нейросетей, по критериям уменьшение вычислительной сложности и качество классификации снимков – примене-ние вспомогательных подходов: предобработка изображений и предварительное вычисле-ние энтропии фрагментов. В статье представлен алгоритм предобработки рентгеновского изображения, его деления на фрагменты и вычисления энтропии отдельных фрагментов. В ходе предобработки из всего снимка выделяется интересующая область с легкими и по-звоночником, составляющая около 30-40% всего снимка, далее происходит деление сним-ка на матрицу фрагментов и вычисляется энтропия по формуле Шеннона, за счет анализа отдельных пикселей.

Ключевые слова: энтропия изображения, фрагменты, глубокая сверточная нейросеть, машинное обучение, рентгеновские снимки, вычислительный эксперимент, матрицы элементов, предобработка изображения, статистический анализ, бинарная классификация

05.13.18 - Математическое моделирование, численные методы и комплексы программ
Культура безопасности труда в строительстве как новая концепция
- С.Л. Пушенко
- Е.В. Федина
- Аннотация
- doc
- pdf
В статье приведены статистические данные травматизма и аварийности в строительстве. Отражены понятия культуры безопасности труда.

Ключевые слова: Риск, травмирующие факторы, охрана труда, культура, безопасность, травматизм

28.07.00 - Техносферная безопасность

27.06.2025

Положение о защите персональных данных авторов статей журнала ИВД

Положение о защите, хранении, обработке и передаче персональных данных авторов статей, представляемых для публикации в сетевое издание Ростовского отделения общероссийской общественной организации...

Подробнее...

26.06.2025

Вручение дипломов вновь избранным действительным членам (академикам) и членам-корреспондентам Российской инженерной академии

25 июня 2025 года в Москве в зале Президиума Российской инженерной академии состоялось вручение дипломов вновь избранным действительным членам (академикам) и членам-корреспондентам Академии. В...

Подробнее...

24.06.2025

Собрание Общероссийской общественной организации «Российская инженерная академия»

21 мая 2025 года в Москве в Российском государственном университете имени А.Н. Косыгина (Технологии. Дизайн. Искусство) состоялось Собрание (Конференция) Общероссийской общественной организации...

Подробнее...

25.05.2025

Всероссийская конференция «Информационные технологии в промышленности 2025»

Всероссийская конференция «Информационные технологии в промышленности 2025» состоится 15 августа 2025 г. в Москве. Всероссийская конференция «Информационные технологии в промышленности 2025»...

Подробнее...

25.05.2025

Международная научная конференция «Современные методы, проблемы и приложения теории операторов и гармонического анализа - 2025"

Международная научная конференция «Современные методы, проблемы и приложения теории операторов и гармонического анализа - 2025" (OTHA-2025)» пройдет в Ростове-на-Дону с 24 по 29 августа 2025.

Подробнее...

25.05.2025

HoReCa PRO Business 2025 - международный форум индустрии гостеприимства

HoReCa PRO Business 2025 - международный форум индустрии гостеприимства пройдет 21 августа 2025 г. в Санкт-Петербурге.

Подробнее...

Разработка сервиса для генерации словоформ в корпусной лингвистике

Разработка веб-сервиса для поиска файлов по ключевым словам

Оценка энтропии фрагментов рентгеновских изображений легких

Культура безопасности труда в строительстве как новая концепция

Новости

Архив новостей