ruby-dev (Japanese) list archive (unofficial mirror)
 help / color / mirror / Atom feed
* [ruby-dev:51000] 2.7までで動いていたが3.0でエンコードのエラーになる
@ 2021-01-28 14:28 paptimusx
  2021-01-29 15:05 ` [ruby-dev:51001] 2.7までで動いていたが3.0でエンコードのエラーになる U.NAKAMURA
  0 siblings, 1 reply; 5+ messages in thread
From: paptimusx @ 2021-01-28 14:28 UTC (permalink / raw)
  To: ruby-dev

[-- Attachment #1: Type: text/plain, Size: 1157 bytes --]

Windows10  (64ビット,日本語環境,cp932)
2.7までで動いていたが3.0でエラーになるようになった
2.7,3.0 ともchocolatelyで入れたもの
エンコーディングの仕様が変わったのでしょうか

再現のための短いコードを添付します
$ ver
Microsoft Windows [Version 10.0.19041.746]

$ cat a.txt
入力データ

$ cat a.rb
#!/usr/bin/ruby
#; coding: cp932
files = ARGV

for file in files
  $stderr.print "[#{file}]\n"
  fin = open(file, 'r')
  title = ' '
  while s = fin.gets
    if /\%TITLE=(.*):(.*)/i =~ s # ←10行目
      title = $2
    end
  end
  fin.close
end

------------------------------------------------------------
× Ruby 3.0

$ ruby -v
ruby 3.0.0p0 (2020-12-25 revision 95aff21468) [x64-mingw32]

$ ruby a.rb a.txt
[a.txt]
a.rb:10:in `block in <main>': invalid byte sequence in UTF-8 (ArgumentError)
        from a.rb:5:in `each'
        from a.rb:5:in `<main>'


------------------------------------------------------------
〇 Ruby2.7

$ ruby -v
ruby 2.7.1p83 (2020-03-31 revision a0c7c23c9c) [x64-mingw32]

$ ruby a.rb a.txt
[a.txt]

[-- Attachment #2: Type: text/html, Size: 1439 bytes --]

^ permalink raw reply	[flat|nested] 5+ messages in thread

* [ruby-dev:51001] Re: 2.7までで動いていたが3.0でエンコードのエラーになる
  2021-01-28 14:28 [ruby-dev:51000] 2.7までで動いていたが3.0でエンコードのエラーになる paptimusx
@ 2021-01-29 15:05 ` U.NAKAMURA
  2021-02-03 15:01   ` [ruby-dev:51012] " paptimusx
  0 siblings, 1 reply; 5+ messages in thread
From: U.NAKAMURA @ 2021-01-29 15:05 UTC (permalink / raw)
  To: Ruby developers (Japanese)

こんにちは、なかむら(う)です。

In message "[ruby-dev:51000] 2.7までで動いていたが3.0でエンコードのエラーになる"
  on Thu, 28 Jan 2021 23:28:36 +0900, paptimusx@gmail.com wrote:
> Windows10  (64ビット,日本語環境,cp932)
> 2.7までで動いていたが3.0でエラーになるようになった
> 2.7,3.0 ともchocolatelyで入れたもの
> エンコーディングの仕様が変わったのでしょうか

3.0より、Windowsにおいてdefault external encodingはUTF-8となりました。
なので、


> $ cat a.rb
> #!/usr/bin/ruby
> #; coding: cp932
> files = ARGV
> 
> for file in files
>   $stderr.print "[#{file}]\n"
>   fin = open(file, 'r')

ここで encoding: 'cp932' あたりを指定してください


それでは。
-- 
U.Nakamaura <usa@garbagecollect.jp>


^ permalink raw reply	[flat|nested] 5+ messages in thread

* [ruby-dev:51012] Re: 2.7までで動いていたが3.0でエンコードのエラーになる
  2021-01-29 15:05 ` [ruby-dev:51001] 2.7までで動いていたが3.0でエンコードのエラーになる U.NAKAMURA
@ 2021-02-03 15:01   ` paptimusx
  2021-02-03 16:18     ` [ruby-dev:51013] " U.NAKAMURA
  0 siblings, 1 reply; 5+ messages in thread
From: paptimusx @ 2021-02-03 15:01 UTC (permalink / raw)
  To: Ruby developers (Japanese)

[-- Attachment #1: Type: text/plain, Size: 1206 bytes --]

ご返信ありがとうございます。

2行目に
coding: cp932
があり、これは効いているはずです。
encoding: cp932
としても同様の動きになります。
外すと動きが変わります。


2021年1月30日(土) 0:11 U.NAKAMURA <usa@garbagecollect.jp>:

> こんにちは、なかむら(う)です。
>
> In message "[ruby-dev:51000] 2.7までで動いていたが3.0でエンコードのエラーになる"
>   on Thu, 28 Jan 2021 23:28:36 +0900, paptimusx@gmail.com wrote:
> > Windows10  (64ビット,日本語環境,cp932)
> > 2.7までで動いていたが3.0でエラーになるようになった
> > 2.7,3.0 ともchocolatelyで入れたもの
> > エンコーディングの仕様が変わったのでしょうか
>
> 3.0より、Windowsにおいてdefault external encodingはUTF-8となりました。
> なので、
>
>
> > $ cat a.rb
> > #!/usr/bin/ruby
> > #; coding: cp932
> > files = ARGV
> >
> > for file in files
> >   $stderr.print "[#{file}]\n"
> >   fin = open(file, 'r')
>
> ここで encoding: 'cp932' あたりを指定してください
>
>
> それでは。
> --
> U.Nakamaura <usa@garbagecollect.jp>
>
>

[-- Attachment #2: Type: text/html, Size: 1828 bytes --]

^ permalink raw reply	[flat|nested] 5+ messages in thread

* [ruby-dev:51013] Re: 2.7までで動いていたが3.0でエンコードのエラーになる
  2021-02-03 15:01   ` [ruby-dev:51012] " paptimusx
@ 2021-02-03 16:18     ` U.NAKAMURA
  2021-02-03 16:43       ` [ruby-dev:51014] " paptimusx
  0 siblings, 1 reply; 5+ messages in thread
From: U.NAKAMURA @ 2021-02-03 16:18 UTC (permalink / raw)
  To: Ruby developers (Japanese)

こんにちは、なかむら(う)です。

In message "[ruby-dev:51012] Re: 2.7までで動いていたが3.0でエンコードのエラーになる"
  on Thu, 4 Feb 2021 00:01:00 +0900, paptimusx@gmail.com wrote:
> 2行目に
> coding: cp932
> があり、これは効いているはずです。

それはソースのエンコーディングの指定です。
言い換えると、コード中の文字列や正規表現のリテラルのエンコーディングを指定しているだけであり、外部エンコーディングには影響はありません。


> > >   fin = open(file, 'r')
> >
> > ここで encoding: 'cp932' あたりを指定してください

ですので、ファイルをオープンする際に、そのファイルのエンコーディングを
  fin = open(file, 'r', encoding: 'cp932')
などといった方法で指定してください。


それでは。
-- 
U.Nakamaura <usa@garbagecollect.jp>


^ permalink raw reply	[flat|nested] 5+ messages in thread

* [ruby-dev:51014] Re: 2.7までで動いていたが3.0でエンコードのエラーになる
  2021-02-03 16:18     ` [ruby-dev:51013] " U.NAKAMURA
@ 2021-02-03 16:43       ` paptimusx
  0 siblings, 0 replies; 5+ messages in thread
From: paptimusx @ 2021-02-03 16:43 UTC (permalink / raw)
  To: Ruby developers (Japanese)

[-- Attachment #1: Type: text/plain, Size: 947 bytes --]

なかむら(う)さま

ありがとうございます。理解しました。

WindowsのRubyの場合、インストーラによっては
環境変数RUBYOPTでutf-8が指定されてしまうのでそれは削除してあります。

$ set rubyopt
環境変数 rubyopt が定義されていません

$ c:\tools\ruby27\bin\ruby.exe -e "print Encoding.locale_charmap"
CP932
$ c:\tools\ruby30\bin\ruby.exe -e "print Encoding.locale_charmap"
CP932
$ c:\tools\ruby30\bin\ruby.exe -e "print Encoding.default_external"
UTF-8
$ c:\tools\ruby27\bin\ruby.exe -e "print Encoding.default_external"
Windows-31J

ところで -Ks オプションはまだ残っているようで、これを使うと
openに引数をつけてまわるよりもだいぶ楽ですが、
いまさらこれに頼るのはあまりよろしくないでしょうか。
$ c:\tools\ruby30\bin\ruby.exe -Ks -e "print Encoding.default_external"
Windows-31J

[-- Attachment #2: Type: text/html, Size: 1202 bytes --]

^ permalink raw reply	[flat|nested] 5+ messages in thread

end of thread, other threads:[~2021-02-03 16:43 UTC | newest]

Thread overview: 5+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2021-01-28 14:28 [ruby-dev:51000] 2.7までで動いていたが3.0でエンコードのエラーになる paptimusx
2021-01-29 15:05 ` [ruby-dev:51001] 2.7までで動いていたが3.0でエンコードのエラーになる U.NAKAMURA
2021-02-03 15:01   ` [ruby-dev:51012] " paptimusx
2021-02-03 16:18     ` [ruby-dev:51013] " U.NAKAMURA
2021-02-03 16:43       ` [ruby-dev:51014] " paptimusx

This is a public inbox, see mirroring instructions
for how to clone and mirror all data and code used for this inbox;
as well as URLs for NNTP newsgroup(s).