тролль - это не только ценный жир, но и 3-4 легкоусвояемых коммента ежедневно
Господа, не знаю где спросить.
Что вот это вот за безобразие во второй половине РУССКОЙ кодовой страницы Win1251 ?
Эти символы ОС считает полноценными буквами алфавита (т.е., upper() и lower() преобразуют их из строчных в прописные и обратно).
Я - русский человек, но не знаю этих букв.
Просветите, пжлст.
131 ѓ Ѓ
144 ђ Ђ
154 љ Љ
156 њ Њ
157 ќ Ќ
158 ћ Ћ
159 џ Џ
162 ў Ў
179 і І
180 ґ Ґ
186 є Є
188 ј Ј
190 ѕ Ѕ
191 ї Ї
Стоит вопрос о написании библиотеки, в которую намертво вшита 1251-ая кодовая страница (т.е., библиотека должна корректно работать с текстами в 1251-ой кодировке, даже если ОС не поддерживает её).
Этой библиотекой будут пользоваться другие программисты для каких-то своих целей.
Но мне не хотелось бы тащить туда всякий хлам.
Возможны ли такие случаи, когда эти буквы будут реально использованы в текстах?
Или эти якобы буквы можно безболезненно убрать и забыть как страшный сон, ибо они никогда не используются?
Что вот это вот за безобразие во второй половине РУССКОЙ кодовой страницы Win1251 ?
Эти символы ОС считает полноценными буквами алфавита (т.е., upper() и lower() преобразуют их из строчных в прописные и обратно).
Я - русский человек, но не знаю этих букв.
Просветите, пжлст.
131 ѓ Ѓ
144 ђ Ђ
154 љ Љ
156 њ Њ
157 ќ Ќ
158 ћ Ћ
159 џ Џ
162 ў Ў
179 і І
180 ґ Ґ
186 є Є
188 ј Ј
190 ѕ Ѕ
191 ї Ї
Стоит вопрос о написании библиотеки, в которую намертво вшита 1251-ая кодовая страница (т.е., библиотека должна корректно работать с текстами в 1251-ой кодировке, даже если ОС не поддерживает её).
Этой библиотекой будут пользоваться другие программисты для каких-то своих целей.
Но мне не хотелось бы тащить туда всякий хлам.
Возможны ли такие случаи, когда эти буквы будут реально использованы в текстах?
Или эти якобы буквы можно безболезненно убрать и забыть как страшный сон, ибо они никогда не используются?
т.е., этих букв хватит на все эти языки?
а как же порядок букв в алфавите? для 1251 он вроде задан единственным образом, в других указанных вами языках порядок букв должен совпадать с русским?
но про порядок букв при совмещении алфавитов там - ничего
Последовательности букв в алфавитах можете глянуть тут, например:
http://ru.wikipedia.org/wiki/Русский_алфавит
http://ru.wikipedia.org/wiki/Сербский_кириллический_алфавит
http://ru.wikipedia.org/wiki/Болгарский_алфавит
http://ru.wikipedia.org/wiki/Белорусский_алфавит
http://ru.wikipedia.org/wiki/Украинский_алфавит
Разумеется, числовая последовательность кодов не соответствует алфавитной.
Но для 1251-ой кодировки (как и для любой другой) установлена последовательность кодов, которая соответствует алфавиту (иначе откуда компьютер знает, как упорядочить файлы в папке по алфавиту)
Парадокс - 4 языка, а кодировка (а значит, и последовательность, задающая алфавит) - одна.
поэтому достаточно одной сортировки букв для всех алфавитов сразу
Џ.txt
на русской винде встаёт между
Ч.txt
и
Ш.txt
сэкономили, типа...
спасибо, всё прояснилось
исходный вопрос решён - украинские, белорусские, болгарские и сербские товарищи посылаются куда подальше
мусор из кодовой страницы убираю