Участник:Khar

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
м (Тема: ОПТИМАЛЬНАЯ КЛАСТЕРИЗАЦИЯ)
м (Тема: ОПТИМАЛЬНАЯ КЛАСТЕРИЗАЦИЯ)
Строка 10: Строка 10:
'''Комментарий:''' Эту программу можно будет применять для эффективного детектирования объектов, если добавить в нее управляющий параметр, который задает базисное число тонов в изображении. В данной предварительной версии параметр фиксирован и равен 2.
'''Комментарий:''' Эту программу можно будет применять для эффективного детектирования объектов, если добавить в нее управляющий параметр, который задает базисное число тонов в изображении. В данной предварительной версии параметр фиксирован и равен 2.
-
'''ПРИМЕЧАНИЕ: В подразделе выше выложены несколько программ, созданных в процессе разработки, так называемой, Shcolar-модели детектирования объектов на
+
'''ПРИМЕЧАНИЕ:
 +
 
 +
В подразделе выше выложены несколько программ, созданных в процессе разработки, так называемой, Shcolar-модели детектирования объектов на
цветовом изображении. Это программы, написаны в процессе исследования в авторском стиле, который обеспечивает:
цветовом изображении. Это программы, написаны в процессе исследования в авторском стиле, который обеспечивает:

Версия 09:33, 27 декабря 2021

Харинов Михаил Вячеславович

ктн, доц., c.н.с. Санкт-Петербургского ин-та информатики и автоматизации РАН (СПИИРАН).

Содержание

[убрать]

Тема: ОПТИМАЛЬНАЯ КЛАСТЕРИЗАЦИЯ

Здесь можно скачать оптимальные приближения вместе с суперпикселями для изображения Лена, а также программу, с помощью которой они вычислены.

Здесь можно скачать программу вычисления иерархии приближений полутонового изображения Иерархическим методом Оцу, а также тестовые результаты для стандартного изображения Лена. Комментарий: Эту программу можно будет применять для эффективного детектирования объектов, если добавить в нее управляющий параметр, который задает базисное число тонов в изображении. В данной предварительной версии параметр фиксирован и равен 2.

ПРИМЕЧАНИЕ:

В подразделе выше выложены несколько программ, созданных в процессе разработки, так называемой, Shcolar-модели детектирования объектов на 
цветовом изображении. Это программы, написаны в процессе исследования в авторском стиле, который обеспечивает: 

а) исключение ошибок программирования; 

б) возможность вернуться к редактированию программы через несколько лет. 

Программы написаны в разные годы в структуре данных, которая совершенствовалась по мере разработки. Для практического использования программы требуют очевидных доработок, но сами доработки перестали быть интересными для автора после завершения построения Shcolar-модели. 

М.В. Харинов 2021 г. 

Kharinov M. Scholar Model of Images, Objects and Superpixels in Questions and Answers Комментарий: Это заготовка позиционной статьи про математическую модель изображения, его элементов (суперпикселей) и объектов на изображении, которую планируется напечатать в приличном зарубежном журнале.

Mikhail Kharinov Clustering for Detection of Binary Object Hierarchy Using Modernized Classical Clustering Methods // Pattern Recognition and Information Processing (PRIP'2021) : Proceedings of the 15th International Conference, 21–24 Sept. 2021, Minsk, Belarus. – Minsk : UIIP NASB, 2021. pp. 198–201. Статья: https://prip.by/2021/assets/files/papers/2124092021PRIP_proceedings_B5-6.pdf ВидеоПрезентации: https://www.youtube.com/watch?v=0clNRv9D5wI&start=4156&autoplay=1 .

Kharinov M.V. Superpixel Clustering // 2020 International Russian Automation Conference (RusAutoCon), 05-11 Sept. 2021, Sochi, Russia, IEEE Publisher, 2021, pp. 303-308. DOI: 10.1109/RusAutoCon52004.2021.9537461 URL: https://ieeexplore.ieee.org/abstract/document/9537461 Комментарий: В статьях дано строгое определение суперпикселей, т.е. элементарных множеств пикселей,из которых состоит изображение и объекты, детектируемые компьютером. В следующих статьях будет описываться математическая модель детектирования объектов в целом.

Харинов М.В. Минимизация ошибки аппроксимации структурированного изображения кусочно–постоянными приближениями // Математические методы распознавания образов (ММРО-2019) / Тезисы докладов 19-й Всероссийской конференции с международным участием, М.: Россйская академия наук, 26-29 ноября 2019. C. 159–164.

Доклад на русском и английском Презентация на русском, на английском,DOI: 10.13140/RG.2.2.18755.35363

Комментарий: В презентации дано строгое определение суперпикселей, т.е. элементарных множеств пикселей, из которых состоит изображение и объекты, детектируемые компьютером.

Kharinov M., Buslavsky A. Object Detection in Color Image // Pattern Recognition and Information Processing (PRIP’2019) / Proceedings of the 14th International Conference. — Minsk: Publishing Center of BSU, 21–23 May 2019, pp. 43–47.

DOI:10.13140/RG.2.2.28493.28640 (Presentation)

Комментарий: В докладе и презентации прогнозируется отставание на 5-10 лет России от США в области создания инструментария для изготовления программ ИИ, в частности, ПО компьютерного зрения. Ожидается, что требуемый инструментарий изготовят в США и выложат в открытый доступ, чтобы снизить стоимость разработки программных продуктов.

Харинов М.В. Обратимое слияние структурированных кластеров пикселей // Компьютерная графика и зрение (Графикон’2016) / Труды 26-й международной конференции по компьютерной графике и зрению: Москва, МГУ им. М. В. Ломоносова, 19 – 23 сентября 2014 г., Нижний Новгород, — С. 298–302.

Комментарий: Статья с некоторыми деталями вычислений.

Харинов М.В., Ханыков И. Г. Применение метода Уорда для кластеризации пикселей цифрового изображения // Вестник Бурятского государственного университета. Математика, информатика. Улан-Удэ: Изд-во Бурятского госуниверситета, 2016. №4. — С. 34-42. — ISSN 2304-5728

Комментарий: Статья - про то, как быстро сосчитать иерархию кластеров по Уорду.

Kharinov M.V. Reversible Image Merging for Low-level Machine Vision, arXiv preprint, http://arxiv.org/abs/1604.03832

Харинов М.В. Основы модели квазиоптимальных приближений изображения // Вестник Бурятского государственного университета. Cерия Математика и информатика / №1, Улан-Удэ: Изд-во Бурятского госуниверситета, 2016. — С. 60-72. — ISSN 2304-5728

Комментарий: Статьи - про модель изображения и объектов.

Харинов М.В., Ханыков И.Г. Комбинированный метод улучшения сегментации изображения // Вестник Бурятского государственного университета. Cерия Математика и информатика / №9, Улан-Удэ: Изд-во Бурятского госуниверситета, 2015. — С. 118-124. — ISSN 1994-0866

Комментарий: Статья представляет практическую реализацию комбинированного глобально-локального метода улучшения качества сегментации в актуальном приложении выделения объектов на изображениях, снятых в различном ракурсе.

Харинов М.В., Ханыков И.Г. Оптимизация кусочно-постоянного приближения сегментированного изображения // Труды СПИИРАН. 2015. Вып. 3(40). С. 183–202.

Комментарий: В статье теоретически и экспериментально обосновывается классическая оценка качества разбиения в приложении к кластеризации пикселей и сегментации изображения. Методы улучшения сегментации разделяются на глобальные и локальные. Обсуждается унифицированный алгоритм глобального улучшения сегментации цветового изображения, названный SI-методом.

Харинов М.В. Улучшение качества приближения цифрового изображения на основе иерархической сегментации // Вестник Бурятского государственного университета. Математика и информатика. 2014. № 9-3. С. 54-57.

Комментарий: Статья - про алгоритм улучшения сегментации изображения тривиальным методом слияния/разделения сегментов. Обеспечивает эффект метода K-средних или более сильного метода С.Д. Двоенко "K-средних без средних". Но, в отличие от методов K-средних, сохраняет число сегментов в разбиении. Не тривиальна программная реализация в терминах динамических деревьев Слейтора-Тарьяна.

Харинов М.В., Заболотский В.П. Критическая технология квазиоптимального машинного зрения // Информатизация и связь / №3, 2014. — М., С. 43-46.

Комментарий: Статья с минимумом формул и упором на обобщение постановки задачи сегментации (на выходе не единственное разбиение изображения, а последователь- ность разбиений), и задачи оптимизации (на выходе — квазиоптимальные разбиения, которые, в отличие от оптимальных разбиений, составляют иерархическую последователь- ность. Плюс генерация автоматических меток объектов). Минимум ссылок, в том числе — на работы С.Д. Двоенко.

Харинов М.В. Кластеризация пикселей для сегментации цветового изображения // Компьютерная графика и зрение (Графикон’2014) / Труды 24-й международной конференции по компьютерной графике и зрению, Ростов-на-Дону: Академия архитектуры и искусств ЮФУ, 30 сентября – 3 октября 2014 г., С. 123–126.

Комментарий: в статье представлен алгоритм иерархической квазиоптимальной кластеризации/сегментации, который обеспечивает реальную минимизацию суммарной квадратичной ошибки при заранее заданном ограничении на число сегментов в кластерах. Приводится формула суммирования квадратичных ошибок при слиянии нескольких кластеров пикселей. Эта формула обобщает выражение квадратичной ошибки для кластера из отдельных пикселей, которое в различных приложениях кластерного анализа используется в трудах Сергея Даниловича Двоенко.

Харинов М.В. Альтернатива иерархическому методу Оцу для цветового изображения. // Вестник Бурятского государственного университета. Математика и информатика / №9, Улан-Удэ: Изд-во Бурятского госуниверситета, 2014. С. 64-72.

Комментарий: в статье наш метод квазиоптимальной иерархической кластеризации пикселей и сегментации изображения обобщается на случай цветовых изображений. Кластеризация пикселей серого изображения выполняется так же эффективно, как в иерархическом методе Оцу. В отличие от метода Оцу, наш метод остается применимым для цветового изображения.

Харинов М.В. Hierarchical pixel clustering for image segmentation, arXiv preprint, http://arxiv.org/abs/1401.5891

Комментарий: в статье предлагается метод квазиоптимальной (близкой к оптимальной) иерархической сегментации изображения посредством кластеризации пикселей. Сначала выполняется квазиоптимальная кластеризация, а затем уменьшается число сегментов в кластерах при контролируемом сопутствующем снижении качества разбиений изображения.

Харинов М.В. Image segmentation by optimal and hierarchical piecewise constant approximations, arXiv preprint, http://arxiv.org/abs/1306.2159

Комментарий: в статье задается вопрос, - нельзя ли оптимальные приближения изображения аппроксимировать иерархическими? Ответ положительный.

1) Харинов М.В. Обобщение трех подходов к оптимальной сегментации цифрового изображения // Труды СПИИРАН. 2013. Вып. 2(25). С. 294–316.

2) Харинов М.В. Модель локализации объектов на цифровом изображении // Вестник Бурятского государственного университета. Математика и информатика / №9, Улан-Удэ: Изд-во Бурятского госуниверситета, 2013. С. 182-189.

Комментарий: Первая статья без картинок — про две операции с кластерами пикселей: a)слияние кластеров и b)реклассификацию части пикселей из одного кластера в другой, с подробным описанием формул в порядке их получения без громоздких выкладок. Во второй статье вводится третья операция — с)дробление кластера, и все три операции иллюстрируются на примере оптимизации разбиений изображения на связные сегменты.

Харинов М.В. Reclassification formula that provides to surpass K–means method, arXiv preprint, http://arxiv.org/ftp/arxiv/papers/1209/1209.6204.pdf

Комментарий: статья про элементарную формулу, которая в упрощенном виде приводит к методу k-средних, а без упрощения, к более сильному методу кластеризации, который состоит в непосредственной реклассификации подмножества элементов из одного кластера в другой, минуя стадию вычисления центров кластеров.

Тема: СТРУКТУРА ДАННЫХ ДЛЯ МУЛЬТИ-СЕГМЕНТАЦИИ ИЗОБРАЖЕНИЙ

Харинов М.В. Разработка динамических структур данных системы автоматизированного распознавания изображений: Автореф. Дис. канд. технич. наук: 05-13-16 — С.П. 1993. — 20 с.

Харинов М.В. Разработка динамических структур данных системы автоматизированного распознавания изображений: Дис. канд. технич. наук: 05-13-16 — С.П. 1993. — 178 с.

Комментарий: диссертация о том, как работать с многочисленными разбиениями, когда изображение не помещается в оперативной памяти. Расчеты выполнялись в терминах динамических деревьев Слэйтора-Тарьяна и редуцируемой "таблицы связности". В современной нотации динамические деревья Слейтора-Тарьяна обозначаются также терминами "Disjoint sets", "Persistent data structures" и "Splay tree".

Тема: ПСЕВДОТРОИЧНАЯ СИСТЕМА СЧИСЛЕНИЯ

Харинов М.В. Недвоичная логика запоминания информации в изображении // 50 лет модулярной арифметике / Матер. межд. конф. 2005. — 8 с.

Харинов М.В. Псевдотроичная система счисления и анализ изображений // Труды СПИИРАН / Под ред. Р. М. Юсупова, Вып. 1, т. 2. – СПб, СПИИРАН 2002. – С. 269-275.

Комментарий: о системе экономичного кодирования иерархии разбиений значениями пикселей некоторого матричного представления изображения.

Тема: МОДЕЛЬ СИГНАЛА С ЦИФРОВОЙ ПАМЯТЬЮ

1) Харинов М.В. Information quantity in a pixel of digital image, arXiv preprint, http://arxiv.org/abs/1401.7517

2) Харинов М.В. Hierarchical pixel clustering for image segmentation, arXiv preprint, http://arxiv.org/abs/1401.5891

Комментарий: первая статья — о целочисленном количестве информации в пикселе изображения, которое определяется для квазиоптимальной иерархии кластеров пикселей, вторая статья — о построении квазиоптимальной иерархии кластеров пикселей или связных сегментов изображения.

Харинов М.В., Заболотский В.П. Стеганографическая защита документов на основе модели запоминания информации изображения // Информация и связь / №1, 2010. — М., — С. 77-81.(см. также статьи М.В.Харинова в выпусках 1(2), 2(1), 3(2), 4 и 7 Трудов СПИИРАН)

Комментарий: статья про информацию, которую можно записать в сигнал и потом извлечь из сигнала, обладающего определенной емкостью собственной памяти. Доступная емкость памяти сигнала позволяет оценить в битах количество информации, которую можно записать в сигнал. Соответствующая целочисленная оценка количества информации получается в предположении, что при приеме известен только алгоритм записи сообщения в сигнал. Ни исходный сигнал, ни встроенное сообщение заранее не известны. Основной результат состоит в том, что полученная оценка совпадает с классическими. Важно, что количество информации при этом оценивается вне связи со сжатием данных.

Тема: ПЕРЕСТАНОВОЧНАЯ СИММЕТРИЯ

M. V. Kharinov Permutable Symmetric Hadamard Matrices in Quaternion Algebra and Engineering Applications // J. Geom. Symmetry Phys. 61, 17–40, 2021, doi:10.7546/jgsp-61-2021-17-40

Комментарий: Это первая после патента СССР № 1799274 серьезная статья в рецензируемом (индексируемом и пр.) журнале. В 1990 г. предполагалось начать с патентования игрушек, а затем раскрыть их научный смысл. Однако, до этой темы дошли руки только сейчас...

Авилов Н.И. Симметричные пиктограммы Харинова // Математика, 2018. №4 С.63.

Комментарий: статья о головоломках по патенту СССР № 1799274.

Харинов М.В. Перестановочная и скрытая симметрия на примере изоморфных матриц Адамара. Приложения в области искусственного интеллекта // Средства математического моделирования / Труды Второй межд. конф. — С.-П.: изд-во СПбГТУ, 1999. T.5 — С 247-254.

Комментарий: статья о том, как изобрести игры типа тех, что предложены в патенте СССР № 1799274.

НОВАЯ Тема: ГИПЕРКОМПЛЕКСНЫЕ ЧИСЛА

Планируемые разделы:

1) АППАРАТ: обобщение векторного произведения на случай трех аргументов для кватернионов и октав.

Kharinov M.V. ,Product of three octonions,Subjects: Mathematics. Rings and Algebras (math.RA), 16 Jan 2018. — 10 p.

Щемелева И.С., Харинов М.В. ,ПРОИЗВЕДЕНИЕ ТРЕХ ВОСЬМИМЕРНЫХ ГИПЕРКОМПЛЕКСНЫХ ЧИСЕЛ (ОКТАВ) // Научное сообщество студентов: МЕЖДИСЦИПЛИНАРНЫЕ ИССЛЕДОВАНИЯ: сб. ст. по мат. XXXVI междунар. студ. науч.-практ. конф. № 1(36). - версия статьи на русском языке

Комментарий: статья полезна для желающих поработать с 8-мерными гиперкомплексными числами (октавами). Все знают, что произведение двух гиперкомплексных чисел раскладывается в сумму антикоммутатора и коммутатора (векторного произведения). Аналогичное разложение нетрудно ввести также и для трех гиперкомплексных чисел. Однако, оно не стало пока общеупотребительным, так как автор - Susumu Okubo представил разложение в незавершенной форме.


2) РАЗЛОЖЕНИЕ ЛИНЕЙНЫХ ПРЕОБРАЗОВАНИЙ НА СИММЕТРИЧНЫЕ И АНТИСИММЕТРИЧНЫЕ КОМПОНЕНТЫ:

Kharinov M.V. , Symmetry of the triple octonionic product,Subjects: Mathematics. Rings and Algebras (math.RA), 14 Jun 2018. — 14 p.

Комментарий: в статье предлагается обобщение общеизвестного эрмитова разложения оператора на симметричную и кососимметричную (антисимметричную) части, которое иллюстрируется на примере произведения 4-мерных кватернионов, или 8-мерных октав справа и слева на центральный аргумент. Как и в предыдущей статье, рассматривается обобщение векторного произведения на случай трех аргументов, для которого предлагается дополнительное обоснование из соображений симметрии. Имеется вариант статьи на русском, который можно получить по запросу. Kharinov M.V. , Symmetry of the triple octonionic product, Subjects: Mathematics. Rings and Algebras (math.RA), 14 Jun 2018. — 14 p.

Kharinov M.V. , Product of Three Octonions // Adv. Appl. Clifford Algebras, Springer Nature Switzerland AG, 29(1), 2018. — 16 p. (Published on line 08 December 2018),doi: 10.1007/s00006-018-0928-x

Комментарий: улучшенная версия предыдущих двух статей в авторитетном журнале, индексируемом в WoS. Еще пара таких публикаций, и можно будет по этой теме публиковаться в Российских журналах, относимых к рецензируемым.

Kharinov M.V. , Sketch on quaternionic Lorentz transformations // International Conference on Polynomial Computer Algebra (PCA’2019), St.Petersburg: Russian Academy of Sciences, St.Petersburg Department of Steklov Mathematical Institute,St.Petersburg Electrotechnical University "LETI", April 15-20, 2019, P. 71–74.

Комментарий: пилотная статья про преобразования Лоренца (в законченном виде см. демонстрацию к FERT-2019). Статья содержит сведения, которых не хватает в справочниках и Википедии. Из-за ограниченного объема чересчур лаконична. Дополнительные формулы можно посмотреть в одноименной презентации.

Примечание: PCA'2008-PCA'2019 — это элитарная международная ленинградская математическая конференция, на которой удалось отметиться в качестве гостя.

Харинов М.В. Квартет собственных векторов для композиции лоренцевских бустов в пространстве кватернионов // XV Международная конференция Финслеровы обобщения теории относительности (FERT-2019). Материалы конференции, Москва, Российский университет дружбы народов, 24–26 октября 2019, С. 195 –200.

DOI: 10.13140/RG.2.2.11847.04001 (презентация)


3) ПРИЛОЖЕНИЯ(если успею):

3.1 Обобщение преобразований Лоренца на 8-мерное пространство октав или октонионов (англ.).

Kharinov M.V. , The Quartet of Eigenvectors for Quaternionic Lorentz Transformation // Adv. Appl. Clifford Algebras, Springer Nature Switzerland AG, 30, 25, 2020. 20 p.

doi: 10.1007/s00006-020-1050-4

Комментарий: статья про преобразования Лоренца. Cодержит сведения, которых не хватает в справочниках и Википедии. Еще одна такая публикация, и можно будет по этой теме публиковаться в Российских журналах, относимых к рецензируемым.

Kharinov M.V. Eigenvalues and eigenvectors for the composition of Lorentz boosts in concise form // International Conference on Polynomial Computer Algebra (PCA’2021), St.Petersburg: Russian Academy of Sciences, St.Petersburg Department of Steklov Mathematical Institute,St.Petersburg Electrotechnical University "LETI", April 12-17, 2020, P. 74–77.

Видео выступления на конференции со слайдами презентации.

Видео - то же самое в YouTube.

Комментарий: решение задачи на собственные значения/вектора. Результат выражается различными эквивалентными формулами. Здесь они в наиболее лаконичной форме.

  3.2 Цветовое преобразование цифровых изображений

МОНОГРАФИИ

Kharinov M.V. Proved Image Segmentation, Chapter 10 in book: Image Processing: Methods, Applications and Challenges /Ed. Vítor Hugo Carvalho, New York: Nova Science Publishers, Inc., 2012.—pp.207-227.(ISBN: 978-1-62081-844-2).

Комментарий: сводка результатов по оптимальной сегментации цифрового изображения по состоянию на 2011 г.

Харинов М.В. Запоминание и адаптивная обработка информации цифровых изображений / Под ред. Р.М. Юсупова. — СПб.: Изд-во С.Петерб. ун-та, 2006. — 138 с. (ISBN: 5-288-04209-8, монография по проекту РФФИ 06-07-95007).

Комментарий: первая глава - про псевдотроичную систему счисления, следующие три главы - про стеганографическое встраивание в изображение произвольных сообщений, пятая глава - про распознавание объектов в терминах динамических деревьев.

ПАТЕНТЫ

МАТЕРИАЛЫ ПО СЕРИИ ИГР "ДАЛЬТОРАДУГА" - прямой доступ

МАТЕРИАЛЫ ПО СЕРИИ ИГР "ДАЛЬТОРАДУГА"

Харинов М.В. Цветовая логическая игра-головоломка "Дальторадуга", патент СССР № 1799274 от 31.10.1990 г., опубл. 28.02.1993. Бюл. № 8.

Комментарий: речь идет о серии развивающих игр, в том числе — электронной игре с перестановочной симметрией. В настоящее время в работе новая игра в виде настольного конструктора, которую продвигают школьники в Литве.

1) Харинов М.В. Двухкомпонентное встраивание сообщений в изображение, совместный патент РФ от СПИИРАН–«Самсунг Электроникс Ко., Лтд.» № 2331085, опубл. 10.08.2008 в офиц. Бюлл. Пат. ведомства РФ № 22. — 31 с.

2) Харинов М.В. Адаптивное встраивание водяных знаков по нескольким каналам, совм. патент РФ от СПИИРАН–«Самсунг Электроникс Ко., Лтд.» № 2329522, опубл. 20.07.2008 в офиц. Бюлл. Пат. ведомства РФ № 20. — 41 с.

Комментарий: пара патентов по стеганографии, главный — второй, впрочем, его тоже давно следовало бы обновить...

Redkov V., Tikotski A., Luciv V., Potapov A., Averkin A., Kharinov M. Mobile robot and the method of location recognization, заявка KR2012-0124909 от 06 ноября 2012 г. на корейский патент от компании LG.

Комментарий: заявка объединяет несколько решений. Решение, разработанное с участием автора, называется "Fast Adaptive Binary-wise Hierarchical Segmentation Method for Detection of Linear Objects".

Личные инструменты