13 января 2017 г.

Часть 1. Clickonce приложение. Пример создания в Visual Studio.

Часть 1. Clickonce приложение. Пример создания в Visual Studio.
Часть 2. Clickonce приложение. Создание с нуля используя утилиту mage.exe.
Часть 3. Clickonce приложение. Альтератива Mage.exe. ClickOnceUtil4.exe утилита для создания ClickOnce приложений.
Часть 4. Clickonce приложение. Что умеет утилита ClickOnceUtil4 и не умеет Mage и её аналоги.

В данной статье будет изложено краткое описание технологии, и пример установки на клиентскую станцию.

Краткое описание.

Microsoft предоставили возможность облегчить труд программистов под Desktop, а именно, процесс установки и обновления вашего приложения на компьютерах пользователей через ClickOnce. Способ достаточно простой и на серверной стороне, которая предоставляет доступ к экземпляру приложения, не требуется никаких дополнительных сервисов, кроме тех которые поддерживают доступ к опубликованному контенту. Клиент сам занимается своим обновлением путем скачивания заведомо сформированных файлов приложения и манифеста. Если у пользователя установлен .NET Framework, то в его составе имеется Engine, которая будет осуществлять процесс установки. От разработчика будет требоваться только контроль за версией приложения.

Из чего состоит ClickOnce приложение?

Для начала, что бы не было путаницы, советую уяснить в голове две вещи:

"Клиентское приложение" - приложение разработанное вами, и именно его планируется устанавливать вашим клиентам.
"ClickOnce приложение" - подготовленное для развертывания "клиентское приложение" и дающее возможность себя устанавливать и обновлять.

Какие минимальные требования к клиентскому приложению?

У вашего решения, которое планируется разворачивать, должен быть хотя бы один исполняемый модуль (*.exe file). Он будет являться "Точкой входа" для вашего запускаемого приложения
Так же сам исполняемый модуль должен быть написан для .NET, иначе у вас не получится создать ClickOnce приложение. НО! При это можно создать .NET Launcher, который после установки запускать ваше Native приложение.

Как создается ClickOnce приложение штатными средствами в Visual Studio?

Для демонстрации Клиентское приложение, которые будем конвертировать в ClickOnce Приложение состоять из 2 файлов:

Исполняемого модуля (WpfApplication4.exe) и (WpfApplication4.exe.config) файла конфигурации. При запуске отображается версия исполняемого файла и путь запуска:

Используя Visual Studio достаточно выбрать ваш исполняемый модуль, зайти в свойства проекта и найти закладку "Publish"

6 января 2017 г.

Почему приложение грузит CPU

Суть проблемы.

Ваше запущенное приложение в какой то момент начинает активно грузить CPU, вас зовёт тестер и просит починить это!

Какие обычные действия программистов в таком случае?

Просят локализовать, если получается, то решить проблему вопрос времени.
Начинается добавление логов, счетчиков проходов и тому подобного. Все отдается тестеру или заказчику с требованием воспроизвести и вернуть лог на анализ. Хорошо если воспроизвести удастся и все станет ясно.
Предположить время, когда "все работало" и по изменениями в системе контроля версий искать возможные причины.

Как проще поступить вэтом случае?

Загрузка CPU означает, что какой то поток(и) обработки данных проснулся\запустился, и стал активно выполнять свою работу или иногда просто зациклился. Узнав стек выполнения в момент нагрузки, можно с высокой долей вероятности понять причину такого поведения.

Как же его можно узнать, ведь мы не находимся под отладчиком? Лично я пользуюсь утилитой Process Explorer дающая возможность увидеть список потоков и их стек. Программа установки не требует.

Для демонстрации я запустил свое приложение с именем процесса "Qocr.Application.Wpf.exe", в которое добавил фейковый код бесконечного цикла. Теперь давайте найдём причину загрузки ядра без отладчика. Для этого я иду в ствойства процесса, далее:

Переходим на вкладку Threads и видим, что имеется 1 поток, который грузит на 16% CPU.
Выделяем этот поток и жмем Stack, открылось окно "Stack for thread ID".
В окне видим, что наш поток был создан тут Qocr.Application.Wpf.exe!<>c.b__36_1+0x3a и в данный момент вызывает GetDirectories из метода InitLanguages().

Продемонстрирую действия выше на изображении со стрелками:

Открыв исходный код программы и перейдя к методу InitLanguages можно увидеть мой фейковый код. Зная эту информацию, а именно место отстановки, можно уже принимать меры.

Код стека (из примера выше) вызывающий бесконечный цикл (Можно проверить):

private void InitLanguages()
{
    new Thread(
        () =>
        {
            while (true)
            {
                var dir = Directory.GetDirectories(@"C:\");
            }
            ;
        }).Start();
}

Ложка дегтя в бочке с медом.

Два момента, которые стоит знать, если решите воспользоваться способом выше:

Потоки созданные CLR (созданные в коде .NET приложения) после останова не продолжают выполнение. В результате чего поток останавливается и остается висеть до перезапуска программы.
Если стек исполнения не содержит полезной информации, то стоит проделать остановку и просмотр стека несколько раз. Вероятность наткнуться на место зацикливания очень велика.

Быстрый способ распознавания текста

Предисловие.

Данный проект не претендует на звание первого места в мире и не рассматривается как конкурент FineReader, но надеюсь, что идея распознавания образов символов используя эйлеровую характеристику будет новой.

Знакомство с эйлеровой характеристикой изображения.

Основная идея состоит в том, что берется черно белое изображение, и считая, что 0 это белый пиксель, а 1 это черный пиксель, тогда все изображение будет представлять из себя матрицу из нулей и единиц. В таком случае, черно-белое изображение можно представить как набор фрагментов размером 2 на 2 пикселя, все возможные комбинации представлены на рисунке:

Теперь, зная фрагменты, можно посчитать их количество, в результате получится характеристический набор [F0, F1, F2, F3...F15], который будет уникален для любого изображения. Ниже приведен пример алгоритма подсчета фрагментов:

На каждом изображение pic1, pic2,... изображен красный квадрат шага подсчёта в алгоритме, внутри которого один из фрагментов F с рисунка выше. На каждом шаге происходит суммирование каждого фрагмента, в результате для изображения Original получим набор: [8,2,2,2,2,0,2,0,2,2,2,0,0,0,0,0], далее он будет называть эйлеровой характеристикой изображения или характеристическим набором.

ЗАМЕЧАНИЕ: на практике значение F0 (для изображения Original это значение 8) не используется, поскольку является фоном изображения. Поэтому будут использоваться 15 значений, начиная с F1 до F15.

Свойства эйлеровой характеристики изображения.

Значение характеристического набора [F1, F2...F15] является уникальным, иными словами не существует два изображения с одинаковой эйлеровой характеристикой.
Нет алгоритма преобразования из характеристического набора в исходное изображение, единственный способ - это перебор.

Каков алгоритм распознания текста?

Идея распознания букв заключается в том, что мы заранее вычисляем эйлеровую характеристику для всех символов алфавита языка и сохраняем это в базу знаний. Затем для частей распозноваемого изображения будем вычислять эйлеровую характеристику и искать её в базе знаний.

Этапы распознавания:

Изображение может быть как черно-белым так и цветным, поэтому первым этапом происходит аппроксимация изображения, то есть получение из него черно белого.
Производим попиксельный проход по всему изображению с целью нахождения черных пикселей. При обнаружении закрашенного пикселя запускается рекурсивная операция по поиску всех закрашенных пикселей прилегающий к найденному и последующим. В результате мы получим фрагмент изображения, который может быть как симвом целиком так и часть его, либо "мусором", которые следует отбросить.
После нахождения всех не связанных частей изображения, для каждого вычисляется эйлеровая характеристика.
Далее в работу вступает анализатор, который проходя по каждому фрагменту определяет, есть ли значение его эйлеровой характеристики в базе знаний. Если значение находим, то считаем, что это распознанный фрагмент изображения, иначе оставляем его для дальнейшего изучения.
Нераспознанные части изображения подвергаются эвристическому анализу, то есть я пытаюсь по значению эйлеровой характеристики найти наиболее подходящее значение в базе знаний. Если же найти не удалось, то происходит попытка "склеить" находящиеся неподалеку фрагменты, и уже для них провести поиск результата в базе знаний. Для чего делается "склеивание"? Дело в том, что не все буквы состоят из одного непрерывного изображения, допустим "!" знак восклицания содержит 2 сегмента (палочка и точка), поэтому перед тем как его искать в базе знаний, требуется вычислить суммарное значение эйлеровой характеристики из обоих частей. Если же и после склейки с соседними сегментами приемлемый результат найти не удалось, то фрагмент считам мусором и пропускаем.

Состав системы:

База знаний - файл или файлы изначально созданные мной, либо кем то ещё, содержащие характеристические наборы символов и требуемые для распознования.
Core - содержит основные функции, выполняющие распознавание
Generator - модуль для создания базы знаний.

ClearType и сглаживание.

Итак, на вход мы имеем распозноваемое изображение, и цель из него сделать черно-белое, подходящее для начала процесса распознавания. Казалось бы, чего может быть проще, все белые пиксели считаем за 0, а все остальные остальные 1, но не все так просто. Текст на изображении может быть сглаженным и не сглаженным. Сглаженные символы смотрятся плавными и без углов, а не сглаженные будут выглядеть на современным мониторах с заметными глазу пикселями по контуру. С появлением LCD (жидкокристаллических) экранов были созданы ClearType (для Windows) и другие виды сглаживания, которые пользуясь особенностями матрицы монитора. Меняют цвета пиксели изображения текста, после чего он выглядит намного "мягче". Что бы увидеть результат сглаживания, можно напечатать какую то букву (или текст) к примеру в mspaint, увеличить масштаб, и ваш текст превратилась в какую то разноцветную мозаику.

В чем же дело? Почему на маленьком масштабе мы видим обычный символ? Неужели глаза нас обманываю? Дело в том, что пиксель LCD монитора состоит не из единого пикселя, который может принимать нужный цвет, а из 3 субпикселей 3 цветов, которых хватает для получения нужного цвета. Поэтому цель работы ClearType получить наиболее приятный глазу текст используя особенность матрицы LCD монитора, а это достигается с помощью субпиксельного рендеринга. У кого есть "Лупа" можете, с целью эксперимента, увеличить любое место включенного экрана и увидеть матрицу как на картинке ниже.

На рисунке показан квадрат из 3х3 пикселей LCD матрицы.

Внимание! Данная особенность усложняет получение черно белого изображения и очень сильно влияет на результат, поскольку не всегда даёт возможность получить такое же изображение, эйлеровая характеристика которого сохранена в базу знаний. Тем самым различие изображений заставляет выполнять эвристический анализ, которые не всегда может быть удачным.

Получение черно-белого изображения.

Найденные в интернете алгоритмы преобразования цветного в черно-белое меня не устроили качеством. После их применения, образы символов подвергнутых сублепиксельному рендеренгу, становились разными по ширине, появлялись разрывы линий букв и непонятный мусор. В итоге решил получать черно-белого изображения путем анализа яркости пикселя. Черным считал все пиксели ярче (больше величины) 130 единиц, остальные белые. Данный способ не идеален, и все равно приводит к получению неудовлетворительного результата если меняется яркость текста, но он хотя бы получал схожие со значениями в базе знаний изображения. Реализацию можно посмотреть в классе LuminosityApproximator.

База знаний.

Изначальная задумка наполнения базы знаний была такая, что я для каждой буквы языка подсчитаю эйлеровую характеристику получаемого изображения символа для 140 шрифтов, которые установлены у меня на компьтере (C:\Windows\Fonts), добавлю ещё все варианты типы шрифтов (Обычный, Жирный, Курсив) и размеры с 8 до 32, тем самым покрою все, или почти все, вариации букв и база станет универсальной, но к сожалению это оказалось не так хорошо как кажется. С такими условиями у меня получилось вот что:

Файл базы знаний получился достаточно большим (около 3 мегабайт) для русского и английского языка. Не смотря на то, что эйлеровая характеристика хранится в виде простой строки из 15 цифр, а сам файл представляет из себя сжатый архив (DeflateStream), который потом распаковывается в памяти.
Около 10 секунд у меня занимает десериализация базы знаний. При этом страдало время сравнения характеристических наборов. Функцию для вычисления GetHashCode() подобрать не получилось, поэтому пришлось сравнивать поразрядно. И по сравнению с базой знаний из 3-5 шрифтов, время анализа текста с базой в 140 шрифтов увеличиволось в 30-50 раз. При этом в базу знаний не сохраняются одинаковые характеристические наборы, не смотря на то, что некоторые символы в разных шрифтах могут выглядеть одинаково и быть схожими даже есть это к примеру 20 и 21 шрифт.

Поэтому пришлось создать небольшую базу знаний, которая идет внутри Core модуля, и даёт возможность проверить функционал. Есть очень серьезная проблема при наполнении базы. Не все шрифты отображают символы небольшого размера корректно. Допустим символ "e" при отрисовке 8 размером шрифта по имени "Franklin Gothic Medium" получается как:

И мало чем похож на оригинал. При этом если добавить его в базу знаний, то это очень ухудшит результаты эвристики, так как вводит в заблуждение анализ символов похожих на этот. Данный символ получался у разных шрифтов для разных букв. Сам процесс наполнения базы знания нужно контролировать, что бы каждое изображение символа, перед сохранением в базу знаний, проверялось человеком на соответствие букве. Но у меня, к сожалению, столько сил и времени нет.

Алгоритм поиска символов.

Скажу сразу, что изначально я недооценил эту проблему с поиском и забыл о том, что символы могу состоять из нескольких частей. Мне казалось, что в ходе попиксельного прохождения я буду встречать символ, находить его части, если таковые имеются, объдинять их и анализировать. Обычный проход выглядил бы так, что я нахожу букву "H" (В базе знаний) и считаю, что все симолы нижие верхней точки и выше нижней точки относятся к текущей строке и должны ализировать в связке:

Но это идеальная ситуация, мне же в ходе распознования приходилось иметь дело с разобрванными изображениями, которые помимо всего могли иметь и огромное количество мусора, располагаемого рядом с текстом:

На этом изображении слова "yes" попытаюсь объяснить сложность анализа. Будем считать, что это полная строка, но при этом b13 и i6 это фрагменты мусора в результате апроксимации. У символа "y" не хватает точки, и при этом ни один из символов не присутсвует в базе знаний, что бы с уверенностью сказать, что мы имеет дело со строкой текста от "c" до "i" строки. А высота строки нам очень важна, так как для склейки нам нужно знать насколько ближайшие фрагменты стоит "склеивать" и анализировать. Ведь может быть ситуация, что мы нечаянно начнём склеивать символы двух строк и результаты такого распознования будут далеки от идеальных.

Эвристика при анализе образов.

Что же такое эвристика при распозновании изображений? Это процесс, в результате которого характеристический набор, не присутсвующий в базе знаний, получается распознать как правильную букву алфавита. Я долго думал, как можно производить анализ, и в итоге наболее удачным алгоритмом получился такой:

Нахожу все характеристические наборы в базе знаний, у которых наибольшее количество значений F фрагментов совпадает с распозноваемым изображением.
Далее выбираю только те характеристические наборы, у которых с распозноваемым изображением по не равным значеним F фрагмента, разница не больше чем на +- 1 единицу: -1 < F < 1. И это все подсчитывается для каждой буквы алфавита.
Затем нахожу символ, который имеет наибольшее число вхождений. Считая его резульатом эвристического анализа.

Этот алгоритм даёт не лучшие результаты на маленьких изображений символов (7 - 12 размер шрифта). Но может быть связанно с тем, что в базе знаний присутсвуют характеристические наборы для схожих изображений разных символов.

Пример использования на языке C#.

Пример начала распознования изображения image. В переменной result будет текст:

var recognizer = new TextRecognizer(container);
var report = recognizer.Recognize(image);
 
// Raw text.
var result = report.RawText();
 
// List of all fragments and recognition state for each ones.
var fragments = report.Symbols;

Демо проект.

Для наглядной демонстарции работы я написал WPF приложение. Запускается оно из проекта с именем "Qocr.Application.Wpf". Пример окна с результатом распознования ниже:

Что бы распознать изображение потребуется:

Нажимает "New Image" выбирает изображение для распознания
Используя режим "Black and White" можно увидить какое изображение будет подвергаться анализу. Если вы видите крайне низкого качества изображение, то не ждите хороших результатов. Что бы улучшить результаты можете попробовать сами написать конвертер цветного изображения в черно белое.
Выбираем язык "Language".
Нажимает распознать "Recognize".

Все фрагменты изображения должны стать помеченными оранжевой или зелёной рамкой.

Оранжевая рамка говори о том, что в ходе эвристического анализа изображение было распознано, но невсегда результат совпадает с оригиналом.
Зелёная рамка говорит о том, что данный символ в черно белом режиме был найден в базе знаний и распознан без использования эвристики.

Пример распознования анлоязычного текста:

Скачать исходный код программы написанной на C#:

C# Разработка

13 января 2017 г.

Часть 1. Clickonce приложение. Пример создания в Visual Studio.

Оглавление

Краткое описание.

Из чего состоит ClickOnce приложение?

Как создается ClickOnce приложение штатными средствами в Visual Studio?

6 января 2017 г.

Почему приложение грузит CPU

Суть проблемы.

Какие обычные действия программистов в таком случае?

Как проще поступить вэтом случае?

Ложка дегтя в бочке с медом.

Быстрый способ распознавания текста

Предисловие.

Знакомство с эйлеровой характеристикой изображения.

Свойства эйлеровой характеристики изображения.

Каков алгоритм распознания текста?

ClearType и сглаживание.

Получение черно-белого изображения.

База знаний.

Алгоритм поиска символов.

Эвристика при анализе образов.

Пример использования на языке C#.

Демо проект.

13 января 2017 г.

Часть 1. Clickonce приложение. Пример создания в Visual Studio.

Оглавление

Краткое описание.

Из чего состоит ClickOnce приложение?

Как создается ClickOnce приложение штатными средствами в Visual Studio?

6 января 2017 г.

Почему приложение грузит CPU

Суть проблемы.

Какие обычные действия программистов в таком случае?

Как проще поступить вэтом случае?

Ложка дегтя в бочке с медом.

Быстрый способ распознавания текста

Предисловие.

Знакомство с эйлеровой характеристикой изображения.

Свойства эйлеровой характеристики изображения.

Каков алгоритм распознания текста?

ClearType и сглаживание.

Получение черно-белого изображения.

База знаний.

Алгоритм поиска символов.

Эвристика при анализе образов.

Пример использования на языке C#.

Демо проект.

13 января 2017 г.

6 января 2017 г.