]> git.vanrenterghem.biz Git - git.ikiwiki.info.git/blobdiff - doc/bugs/removing_pages_with_utf8_characters.mdwn
Assume that every page has been scanned by the time the scan phase ends
[git.ikiwiki.info.git] / doc / bugs / removing_pages_with_utf8_characters.mdwn
index 77ec00575e18b7f0025a342c263245660caad400..0d96aa75f4dfd6b2aee6638a55b27dc2a1273651 100644 (file)
@@ -26,3 +26,26 @@ I wrote the following patch, which seems to work on my machine. I'm running on F
 > code you patched. So I need to understand why that is apparently not
 > working for you. (It works fine for me, even when deleting a file named 
 > "umläute" --[[Joey]] 
 > code you patched. So I need to understand why that is apparently not
 > working for you. (It works fine for me, even when deleting a file named 
 > "umläute" --[[Joey]] 
+
+----
+
+> Update, having looked at the file in the src of the wiki that
+> is causing trouble for remove, it is: `uml\303\203\302\244ute.mdwn`  
+> And that is not utf-8 encoded, which, represented the same
+> would be: `uml\303\244ute.mdwn`
+> 
+> I think it's doubly-utf-8 encoded, which perhaps explains why the above
+> patch works around the problem (since the page name gets doubly-decoded
+> with it). The patch doesn't fix related problems when using remove, etc.
+> 
+> Apparently, on apoca's system, perl encodes filenames differently
+> depending on locale settings. On mine, it does not. Ie, this perl
+> program always creates a file named `uml\303\244ute`, no matter
+> whether I run it with LANG="" or LANG="en_US.UTF-8":
+> 
+>      perl -e 'use IkiWiki; writefile("umläute", "./", "baz")'
+> 
+> Remains to be seen if this is due to the older version of perl used
+> there, or perhaps FreeBSD itself. --[[Joey]] 
+> 
+> Update: Perl 5.10 fixed the problem. --[[Joey]]