Автор Гілка: Стан заміни символа апострофа в основній розкладці  (Прочитано 4573 раз)

Відсутній Володимир Лісівка

  • Адміністратор ЩОДО
  • Видавець
  • *****
  • дописів: 3731
  • Карма: +9/-0
  • Програміст
Передісторія: у 8-ми бітних кодуваннях, в якості символу українського апострофа рекомендується використовувати одинарну лапку з набору символів ASCII з кодом U+0027. Це створювало незручності при наборі українського тексту, так як символи ASCII мають дуже багато застосувань, що призводить до конфліктів і необхідності застосування обхідних рішень, напр. «якщо апостроф стоїть між двома українськими символами, то вважаємо його літерою, а інакше — розділовим знаком».

Для уникнення цих проблем, в стандарті Унікоду був доданий спеціальний символ з кодом U+02BC, який виглядає як апостроф і є літерою, а не розділовим знаком і який використовується в різних мовах, напр. африканських. На жаль, підтримка символу U+02BC в шрифтах є частковою, і шрифтів з рідною підтримкою U+02BC не є так багато як би хотілося (це вирішується шляхом таблиці заміщення символів у шрифті чи у сервері шрифтів), тоді як є подібний на вигляд символ U+2019, який є розділовим знаком (права одинарна лапка при цитуванні), і який значно поширеніший у шрифтах і який також використовується в різних мовах.

При обговоренні шляхів вирішення проблеми з 8-бітним апострофом, було прийнято рішення використати апостроф U+2019 в українській розкладці через технічні проблеми з U+02BC, і відносно слабку реакцію програмного забезпечення на Унікод, яке на той час не вважало U+2019 розділовим знаком, що дозволяло комфортно набирати текст та перевіряти правопис.

На сьогоднішній день ситуація змінилася порівняно з 2007-им роком. Зараз програмне забезпечення сприймає U+2019 саме як розділовий знак а не як якийсь абстрактний «символ унікоду», що призвело до того, що в багатьох місцях, де очікується текст на мові користувача, ввести U+2019 не можна так само як і U+0027. Зокрема цього не можна зробити в доменних іменах, написаних кирилицею. В результаті, був прийнятий стандарт на представлення кирилиці символами Унікоду в доменних іменах, який закріпив статус символу U+02BC як єдиного можливого символу для представлення апострофу в кириличних доменних іменах в українському домені .укр.

Тепер склалася цікава ситуація — апостроф в доменних іменах використовувати можна, але ввести його з клавіатури користувач не може, так як він відсутній на розкладці клавіатури. Для вирішення цієї проблеми, було запропоновано змінити символ U+2019 на U+02BC в основній розкладці клавіатури в X Window і в Android. Запит на зміну в Android ігнорується розробниками, а запит на зміну розкладки в X Window переріс в особистий конфлікт з Андрієм Рисіним. На даний момент Андрій пропонує використовувати як основний символ U+0027, тобто 8-ми бітний символ з усіма його проблемами, а U+02BC вводити через Shift, тобто ми матимемо два символи для апострофу — розділовий знак на кожен день і «правильний» символ для тих місць, де хаки не проходять. В якості обґрунтування, Андрій наводить можливі проблеми з пропрієтарними пошуковими сервісами, такими як Ґуґл, а також результати голосування на нашому сайті, з яких, шляхом математичних обчислень, виводить що за U+02BC проголосувала меншість людей (насправді: більшість).

Обговорення зміни в XKB: https://bugs.freedesktop.org/show_bug.cgi?id=50895 .
Обговорення та голосування на нашому сайті: http://linux.org.ua/cgi-bin/yabb/YaBB.pl?num=1189996822
Обговорення подібної проблеми на сайті Унікоду: http://unicode.org/pipermail/unicode/2015-January/001201.html
« Змінено: 2015-05-28 15:36:15 від lvm »
[Fedora Linux]

Відсутній Re.

  • Загальний модератор
  • Літератор
  • *****
  • дописів: 1898
  • Карма: +1/-0
Тож який вердикт? В обговоренні варіант Андрія підтримують навіть розробники XKB. Проведемо нове опитування?

Для мене варіант Андрія прийнятний: і так маємо два апострофи. Звісно, б хотілось мати єдиний правильний, але варто дочекатись глобальної підтримки того апострофу (той же Ґуґл може додати додаткову умову для своїх запитів), а тоді обговоримо перенесення на нижній рівень як основного.

Наразі слід думати, щоб користувачу найменше нашкодити нововведеннями, бо він може не зрозуміти і ба постраждати.
« Змінено: 2015-05-28 16:17:24 від Re. »

Відсутній noddeat

  • Кореспондент
  • ***
  • дописів: 197
  • Карма: +0/-0
U+2019 ’
U+02BC ʼ


Ви бачите візуальну різницю? Бо я ні. Мені здається, простіше відповідному софту навчитися відрізняти апостроф від одинарної лапки, шо актуально для англійської, в українській воно хіба є? Не бачу в Ґуґла якихось проблем з цим: він узагалі апостроф ігнорує, здається.

Коротше, тре користуватися U+2019 і не придумувати надуманих проблем.
Filenames are infinite in length, where infinity is set to to 255 characters. Peter Collinson, "The Unix File System"

Відсутній Володимир Лісівка

  • Адміністратор ЩОДО
  • Видавець
  • *****
  • дописів: 3731
  • Карма: +9/-0
  • Програміст
U+2019 ’
U+02BC ʼ


Ви бачите візуальну різницю? Бо я ні. Мені здається, простіше відповідному софту навчитися відрізняти апостроф від одинарної лапки, шо актуально для англійської, в українській воно хіба є? Не бачу в Ґуґла якихось проблем з цим: він узагалі апостроф ігнорує, здається.

Коротше, тре користуватися U+2019 і не придумувати надуманих проблем.

Коротше, треба читати довгі тексти. В доменних іменах та інших ідентифікаторах, де розділові знаки не допускаються, розділові знаки не допускаються.
[Fedora Linux]

Відсутній Володимир Лісівка

  • Адміністратор ЩОДО
  • Видавець
  • *****
  • дописів: 3731
  • Карма: +9/-0
  • Програміст
Тож який вердикт? В обговоренні варіант Андрія підтримують навіть розробники XKB. Проведемо нове опитування?

Для мене варіант Андрія прийнятний: і так маємо два апострофи. Звісно, б хотілось мати єдиний правильний, але варто дочекатись глобальної підтримки того апострофу (той же Ґуґл може додати додаткову умову для своїх запитів), а тоді обговоримо перенесення на нижній рівень як основного.

Наразі слід думати, щоб користувачу найменше нашкодити нововведеннями, бо він може не зрозуміти і ба постраждати.

Майнтейнер XKB не є україномовним, і йому глибоко пофіг на наші проблеми. Розробники XKB (якщо ви читали) рекомендують U+02BC.
[Fedora Linux]

Відсутній DalekiyObriy

  • Літератор
  • ******
  • дописів: 1921
  • Карма: +4/-0
Розробники XKB (точніше xkeyboard-config) нічого не рекомендують (як Володимир вже зазначив їм фіолетово, який ми апостроф втулимо).
Нам треба самим визначитися, який апостроф ми поставимо основним (схоже, немає сумнівів що нам ще довго буде потрібно два апострофи).

Тепер давайте подумаємо, яку проблему ми вирішуємо. Володимир каже
Цитата
апостроф в доменних іменах використовувати можна, але ввести його з клавіатури користувач не може, так як він відсутній на розкладці клавіатури
але сайтів, в яких потрібен 02BC я не бачу (окрім зареєстрованого Володимиром мʼясо.укр), хтось може навести список сайтів, в яких потрібно набирати 02BC щоб зрозуміти масштаб проблеми?

Мій аргумент такий: якщо дійсно буде декілька сайтів, на які захочуть ходити люди, то коли це трапиться натиснути shift не є проблемою (і потім якщо сайт того вартий він буде однаково в закладках/улюбленому).

А от шукають в гуглі тисячі людей. Текстів написано з прямим апострофом мільйони. Тому нагальна потреба: мати вживаний апостроф в першому рівні, який дає людям результати, бо якщо кожен день люди будуть отримувати в пошуку 0 результатів і їм треʼ буде згадати натиснути shift для апострофа це буде проблема, а не її вирішення.

І проблема не лише, як каже Володимир
Цитата
з пропрієтарними пошуковими сервісами
, я ось спробував набрати 02BC в «памʼяті» для пошуку на цьому форумі, і нічого не знайшов, як тільки поставив прямий 0027 «пам'яті» то отримав два дописи (один із них новина написана Володимиром!!!). Це добре ілюструє масштаб проблеми з прямим у другому рівні. Тобто звичайно, це можна виправити, але таких ПЗ (пропрієтарних та відкритих) дуже багато, за декілька років, відколи ми підняли цю тему ситуація майже не змінилася. Он putty не дозволяє вводити 02BC через клавіатуру (хоча через вставку бере без проблем), Володимир ніби взявся це поладити, ніби відкритий софт, декілька років по тому: змін немає. Я розумію, що апострофи в putty набираю лише я  ;) але це лише один з прикладів.

Я знову ж таки не проти того, що 02BC є правильнішим (принаймні за Unicode): я додав його підтримку на r2u.org.ua/e2u.org.ua, я додав його підтримку в spell-uk (додатки до Firefox, LibreOffice.org), я додав його підтримку в український модуль LanguageTool, я міркую над тим щоб поміняти всі 2019 на 02BC в усіх словниках r2u/e2u (підтримка 02BC в шрифтах дійсно покращилася за останні роки і звичайно приємніше, коли подвійне клацання на слові з апострофом виділяє його усе а не лише частину). Але є реальність, ну це як винести всі бензинові заправки в Україні за місто й поставити електричні заряджальні станції, хоча останні й «правильніші» за бензинові й повітря в містах буде чистіше, але чи є це добрим вирішенням проблеми?..
Fedora 35 (x86-64)

Відсутній noddeat

  • Кореспондент
  • ***
  • дописів: 197
  • Карма: +0/-0
Коротше, треба читати довгі тексти. В доменних іменах та інших ідентифікаторах, де розділові знаки не допускаються, розділові знаки не допускаються.
я-то читав. це і є надумана проблема, про яку я кажу.

і ше треба відмовлятися від «глобусу України»: апостроф аж ніяк не є чимось специфічним лише для української мови. У нідерландській (або її бельгійській версії — фламандській) мові, наприклад, з апострофу може починатися слово (в т.ч. власні назви). Тому проблема є ширшою за UA-інтернет і потребує системного вирішення на міжнародному рівні.
Filenames are infinite in length, where infinity is set to to 255 characters. Peter Collinson, "The Unix File System"

Відсутній Володимир Лісівка

  • Адміністратор ЩОДО
  • Видавець
  • *****
  • дописів: 3731
  • Карма: +9/-0
  • Програміст
Коротше, треба читати довгі тексти. В доменних іменах та інших ідентифікаторах, де розділові знаки не допускаються, розділові знаки не допускаються.
я-то читав. це і є надумана проблема, про яку я кажу.

і ше треба відмовлятися від «глобусу України»: апостроф аж ніяк не є чимось специфічним лише для української мови. У нідерландській (або її бельгійській версії — фламандській) мові, наприклад, з апострофу може починатися слово (в т.ч. власні назви). Тому проблема є ширшою за UA-інтернет і потребує системного вирішення на міжнародному рівні.

Ви не повірите, але її вирішили.
[Fedora Linux]