Хм.. iconv перелопачує файл повністю. А html-лка в юнікоді це не зовсім те. Подивіться текст гугла і побачите в чому зачіпка.
Тобто, мова про всякі ᄑ штучки (html-entities). Так, вони теж трапляються, але якщо вся сторінка в одному кодуванні (юнікод), то й звичайний текст буде працювати.
Тобто, якщо я маю наприклад сторінку в коі-8 і хочу в неї вставити кілька слів в юнікоді, тоді без всих цих прибамбасів мені не обійтись. А якщо нормальний юнікод -- нормально.
Правда, якщо в вихідному 1251 тексі трапляються ці entity, то їх треба перекодувати. Колись, я писав скриптик для перекодування результатів man2htm в нормальний український текст. Може щось треба буде підправити:
#!/usr/bin/perl
$m2h = "/usr/bin/man2html";
$src = shift;
(( $src eq "" ) or ( ! -f $src )) && do { print "Need a file name \n\n "; exit 1; };
$manpath="/home/users/d/dm/dmytro/utrans/htdocs/mdk/man/";
$CHARSET='<meta http-equiv="Content-Type" content="text/html; charset=koi8-u">';
open FL, " $m2h ${manpath}${src} | ";
while (<FL>) {
while (/(\&\#(\d{3})\;)/) {
$char = chr($2);
s/$1/$char/g;
}
print;
print $CHARSET if ($_ =~ /<HEAD>/);
}