Информационные системы


Текущие проекты

Исследование и разработка методов автоматизации масштабирования и разворачивания виртуальных кластеров для обработки сверхбольших объёмов данных в облачной среде Openstack.

Начало проекта – 2014 год.

Стремительный рост потребностей современного общества в решении задач обработки больших объёмов данных (Big Data) толкает сообщество учёных и разработчиков на поиски новых подходов обработки данных. В последние годы сформировался стек технологий, подходящий для эффективного решения многих задач Big Data, но эти технологии очень разнообразны по своим возможностям и назначениям. Кроме того, эффективность технологий распределённых вычислений напрямую зависит от эффективности механизмов масштабирования.

Разработка масштабируемой программной инфраструктуры для хранения и обработки данных в задачах вычислительной биологии

Начало проекта – 2014 год.

Создание инфраструктуры для обработки генетических данных является перспективным направлением для развития биоинформатики. В настоящее время для решения стандартной задачи исследователь-экспериментатор должен полностью пройти путь расчётов на том вычислительном оборудовании, которое есть у него в наличии; это может отнять у конкретного исследователя несколько недель ожидания подсчёта результатов. Кроме того, вычислительных мощностей может и вовсе не хватить - вычислительная сложность генетических задач может быть очень велика.

Исследование и разработка методов построения и обогащения онтологии на основе коллекции текстовых документов

Начало проекта – 2013 год.

Проект посвящен разработке инструмента для построения онтологии, или базы знаний, системы Texterra на основе анализа текстовых документов определенных предметных областей. Необходимость подобного инструмента вызвана тем, что наиболее распространенным, а иногда и единственным, способом представления знаний во многих предметных областях являются обычные текстовые документы. В настоящее время поддерживается автоматизированное создание онтологии и ведутся разработки полностью автоматических методов.

Исследование и разработка методов распределенной обработки больших баз графовых данных

Начало проекта – 2013 год.

В настоящее время в области хранения и обработки данных наблюдается тенденция перехода от традиционной реляционной модели к использованию специализированных систем (NOSQL), позволяющих оптимизировать решение для заранее определенного класса приложений. В этой области ведутся активные разработки и уже существуют коммерческие системы разрабатываемые и используемые такими компаниями как Google, Microsoft, Facebook, HP и т.д.

Завершенные проекты

Тестирование решений класса In-Memory Data Grid для задач Core banking.

Начало проекта – 2014 год. Окончание проекта - 2014 год.

Проект посвящен тестированию решений класса In-Memory Data Grid в применении к области базовых банковских операций. В качестве решений тестировались GridGain, RedHat Infinispan и Hazelcast.

Visontia - сервис для визуализации базы знаний системы Texterra

Начало проекта – 2014 год. Окончание проекта - 2014 год.

Инструмент VizOntia предназначен для визуализации базы знаний системы Texterra.

Annotame - сервис для автоматизации процесса разметки текстовых документов

Начало проекта – 2013 год. Окончание проекта - 2014 год.

В рамках проекта разработан сервис для автоматизации процесса разметки текстовых документов различными аннотациями, такими как части речи, термины, соответствующие терминам понятия, ключевые понятия и т. п. Интеграция с системой Texterra и удобный Веб-интерфейс значительно упрощают работу пользователей, позволяя за короткое время получать достаточные объемы данных для обучения и тестирования разрабатываемых в отделе алгоритмов, в том числе алгоритмов определения терминов и разрешения лексической многозначности.

WikiXMLDB

Начало проекта – 2010 год. Окончание проекта - 2010 год.

Данный проект предоставляет возможность совершать запросы к Википедии на языке XQuery. Содержимое Википедии было представлено в правильно структурированном XML-формате и загружено в XML-базу данных Sedna. Для запросов на языке XQuery был реализован веб-интерфейс.

Инфраструктура управления контентом и знаниями

Начало проекта – 2008 год. Окончание проекта - 2009 год. Заказчик - Научное издательство "Большая Российская энциклопедия".

Данная инфраструктура предоставляет службы управления полным жизненным циклом знаний и контента, которые используются для разработки современных информационных продуктов, основанных на энциклопедиях и ссылках. XML-СУБД Sedna является главным компонентом инфраструктуры. Она позволяет использовать один и тот же контент в разных документах и форматах, обеспечивает повторное использование контента, превосходные поиск и навигацию, а также значительную гибкость и удобство модификации информационных продуктов.

TweetSieve

Начало проекта – 2008 год. Окончание проекта - 2008 год.

Микроблогосфера обладает уникальными характеристиками: это источник крайне актуальной информации о событиях, происходящих во всем мире. Twitter является наиболее популярным средством ведения микроблогов, поэтому мы разработали систему анализа сообщения Twitter, которую назвали TweetSieve.

BizQuery — виртуальная система интеграции данных, основанная на XML

Начало проекта – 2000 год. Окончание проекта - 2003 год.

BizQuery — это пакет серверов и инструментов для разработки приложений, оперирующих разнородными источниками данных. Главным компонентом пакета является Сервер интеграции BizQuery Integration Server, который предназначен для совершения запросов на языке XQuery к разнородным базам данных. Сервер интеграции BizQuery Integration Server поддерживает концепцию глобальной схемы данных, определенную в XML.

ISP ORB

Начало проекта – 1997 год. Окончание проекта - 1998 год.

ISP C++ ORB — бесплатное инструментальное средство для разработки распределенного программного обеспечения. Брокер объектных запросов (ORB) играет роль коммуникатора между различными компонентами распределенных приложений, которые могут выполняться на разных платформах.

GNU SQL Server

Начало проекта – 1996 год. Окончание проекта - 1999 год.

GNU SQL Server — это бесплатная переносимая многопользовательская реляционная система управления базами данных. Она поддерживает полную версию диалекта SQL89 и имеет некоторые расширения относительно SQL92. GNU SQL Server реализует высокий уровень изолированности транзакций и статическую и динамическую компиляцию запросов. И серверная, и клиентская стороны системы работают на Unix-подобных системах. Клиент-серверное взаимодействие основано на механизме RPC. Взаимодействие серверных процессов основано на механизмах посылки сообщений и разделяемой памяти.