WEBサービス・ツール
目次
ここではブラウザから利用できるツールを紹介します。
パソコンにアプリをインストールしなくても、ネットにつながっていれば利用できます。
ファイル形式変換
文字形式のファイルだけでなく、画像や動画のファイル形式を変更できます。
無料でできるのは 100MB までなので、テキスト形式のファイル変換なら制限を意識しなくても使えます。
AnyConv
https://anyconv.com/ja/
1時間あたりに60つのファイルまで変換でき、100MB以内のファイル変換に対応しています。
Convertio
https://convertio.co/ja/
300以上のファイル形式に対応しています。
動画ファイルを変換すると同時に、動画の画面アスペクト比、コーデックなどを変更、動画を回転・反転などすることもできます。
サインアップしない場合、最大100MBのファイルをアップロード可能で、サインアップすればサイズ制限が解除されます。
画像拡大サービス
画像の品質を保ったまま拡大するサービスです。
AI を使って補完することで、画素が粗くなったり線がギザギザにならずに、画像サイズを大きくできます。
https://topten.ai/ja/image-enlargers-review-ja/
AI技術で動画や画像を高画質化する方法まとめ
https://ameblo.jp/shangshanruoshui01/entry-12649787271.html
Web サービスだと一日に処理できる枚数が限られているので、枚数が多いならアプリ版を使います。
NVIDIA などの GPU を登載しているパソコンをお持ちなら、Batch AI Photo Sharpener の利用を推奨します。
オリジナル ↓
|
2倍(面積4倍)に拡大 ↓
|
kakudaiAC
kakudaiAC は、画像を 2倍(面積だと4倍)に拡大できる Web サービスです。
amazon などのアカウントを使うと、一日 5枚まで無料で利用できます。
https://kakudai-ac.com/
Vance AI のように提供者のロゴが書き込まれることはなく使い易いので、私の推奨です。
Batch AI Photo Sharpener で拡大↓
画像編集サービス
Pixlr
ブラウザ上で使える多機能画像編集ソフトです。
例えば、AIカットアウトを使えば、1クリックで背景を除去できます。
Pixlr X
https://pixlr.com/jp/x/
機能が限定されていて、直感的に利用できる初心者向け
Pixlr E
https://pixlr.com/jp/e/
Photoshop のようなツールを備えた上級者向け
「PIXLR X」で簡単に編集した後「PIXLR E」で仕上げるといった使い方もできます。
使い方
【PIXLR】PIXLR XとEの違い&使い分け【初心者向け講座 動画】#1
https://www.youtube.com/watch?v=tx41DJzg-2c&ab_channel=Pixlr
【Pixlr X入門】「切り抜き・背景消去・ぼかし」+画像読み込み・保存 を3分で解説 動画
https://www.youtube.com/watch?v=Dm2jC4dpB40&ab_channel=LampMate
Pixlr Xの使い方を徹底解説!
https://funtre-blog.com/apps/pixlr-x/
無料で画像のキリヌキをする方法
https://ino-ue.jp/gimon_kaiketsu/quest_122.php
OCR サービス
OCR とは、(optical character recognition とか optical character reader)のことで、画像データから、光学的に文字を読取ることです。
スキャナを買うと、たいていはおまけに、OCRソフトが付いています。
付属の OCRソフトの性能に不満があったり、スキャナを持っていない人は、下記を試してみましょう。
新聞など、薄い紙からOCRする場合は、裏に黒い紙を当ててスキャンすると、裏の文字の透けが邪魔にならず、うまく文字認識できます。
また、OCRソフトで、縦書き、横書きの読み込み指定ができる場合は、明示的に方向を指定したほうが、より正しく認識できます。
私は、スキャンの解像度は、白黒300dpi以上のテキスト読み込みを使っています。ブライトネス(明るさ)は、50〜40程度で調整しています。
白黒化の方法を指定できる場合は、単純2値の、スレッショルド(threshold 閾)法を選択します。ディザモード(誤差拡散法)など、中間調まで取り込む擬似階調画像にすると、文字認識率は、低下してしまいます。
カラー画像からOCRしたい場合は、XnView を使って、「画像」→「モノクロに変換」→「Floyd-Steinberg型(Floyd-Steinberg 誤差拡散法 ディザリング (減色) )」を使うと、OCR 読み取り率が良いようです。
Online OCR
日本語認識率が極めて高い WEB サービスです。
5MB までなら、登録なしで、PDF, JPG, BMP, TIFF, GIF の単一ファイルを読み込むことができます。
縦書き、横書きを、自動認識します。
もう、市販のOCRソフトの時代は終わった、と感じます。
https://www.onlineocr.net/
使い方の紹介
http://ryus.co.jp/blog/online-ocr/
https://nelog.jp/online-ocr
主な手順は以下です。
1.Upload file で、Select file ボタンを使って、パソコンのフォルダにある画像をアップロード
2.Select language and output format で、言語と出力形式を選択
3.右下の確認用の数字を入力(無登録の場合)
4.Convert ボタンを押す
i2OCR
「i2OCR」は、画像内に含まれるテキストを OCR 抽出できるウエブ・サービスです。
アプリではないので、ソフトをダウンロードしたりインストールする必要はありません。
日本語を含む33カ国語に対応しており、このサービスを使って画像内の文字列をテキストデータに変換できます。
日本語認識は、上の「Online OCR」の方が優れています。
http://www.i2ocr.com/free-online-japanese-ocr
使い方の紹介
http://japan.cnet.com/news/society/35007245/
寿司打
『寿司打』はローマ字入力用のタイピング練習ゲームで、お手軽 3000円コースは 60秒で楽しめます。
気分転換に、ゲームを楽しみながらタイピング・レベルを向上できます。
https://sushida.net/
いきなりゲームを始めると、それなりに緊張して実力を発揮できないことがあります。
前もって指ならしで「いろはにほへと・・」「きゃきゅきょ・・」「ファフィフュフェフォトゥ」を数回タイプしてからプレーすると、高得点が期待できます。
「親指シフト入力」の「やまぶきR」を使ってチャレンジできます。「親指シフト入力」の有効性を確認できます。
寿司打の画面上では IME の On/Off を切替えることができません。
このため、IMEの On/Off は、ブラウザの UEL 入力欄にカーソルを置いて、「かな」入力に設定します。
こうすると IME ツールバーが「A」の状態のままで、「やまぶきR」でかな入力できます。
使い方
https://freesoft-100.com/review/sushida.php
Basic Pitch
音楽ファイルや、マイクで入力した音源から、AI を使って MIDI データを作成するウェブサービスです。
https://basicpitch.spotify.com/
MIDI データができれば、後は MuseScore を使えばアレンジして楽譜化するのは自由自在です。
「Basic Pitch」の使い方紹介
https://trivisionstudio.com/spotify-basic-pitch/
k本的に無料ソフト・フリーソフトでの紹介
https://www.gigafree.net/media/encode/Basic-Pitch.html
音楽制作情報サイト DTMer.info での紹介
https://dtmer.info/basic-pitch/
Mage
ネット上の数十億枚の写真やイラストを学習させた AI を使って、キーワードの組合せを与えて自動で画像を制作させるサービスです。
画像生成AI「Stable Diffusion」をブラウザから簡単に使えるようにしたものです。
注意:Mage Update v2.0 で、NSFW (Not safe for work:職場で見ないほうがよい) キーワードを含める場合は、有償になりました。(^^;)
NSFW キーワードには、アダルト系のキーワードが含まれます。
https://www.mage.space/
右の画像を生成したキーワード例:
watercolor beautiful girl head
Mucha style pretty girl
Jean-Marc Nattier style pretty girl
同じキーワードの組合せでも、実行するたびに違う画像が生成されるので、画面右上の×でいったん画像を閉じて、気に入った画像が表示されるまで繰り返すとよいでしょう。
入力フォーム左下の「View Options」から、アカウントにログインして「Advanced Mode」をクリックすると、品質やガイダンス・スケールを細かく調整できるだけでなく、シード値やネガティブプロンプト(望ましくないもの)を入力することもできます。
使い方
https://gigazine.net/news/20221028-
mage-unfiltered-stable-diffusion-review/
画像生成AI Stable Diffusion の衝撃&使い方
https://oiuy.net/archives/25203
誰もが知っておくべき画像生成AI「Stable Diffusion」の仕組みと使い方
https://atmarkit.itmedia.co.jp/
ait/articles/2209/16/news041.html
対話型人工知能
対話型 AI は、文章作成のほか、要約、翻訳、企画書、プログラミングの作成などを短時間で回答します。
使う人が入力するプロンプト(指示や質問)の内容などによって、回答の精度や内容が異なります。
日刊スポーツの記事に、各 AI サービスに「あなたがもし人間になれるとしたら、どんな性別、容姿がいいですか?」と同じ質問をすると、その回答から AI サービスの性格の違いが分かる、と書かれていました。
ChatGPT
利用は無料ですが、最初にアカウントの設定が必要です。
個人情報を収集されないように、専用のメイル・アドレスを使うとよいと思います。少なくとも Google アカウント は使わない方が良いと私は思います。
https://chat.openai.com/
以下は ChatGPT 自身が認識している短所です。
・誤った情報の生成:
時折、ChatGPTは正確な情報を提供する代わりに、誤った情報や不正確な主張を生成することがあります。特に、明確な文脈や証拠がない場合は、慎重に結論を出す必要があります。
・倫理的な懸念:
ChatGPTは人間の言語を模倣するため、時には悪意のある使用や誤解を招く応答を生成することもあります。そのため、倫理的なガイドラインや監視が必要とされます。
ChatGPT(Generative Pre-training Transformer:事前学習して生成する翻訳者)は「artificial intelligence:人工知能」の一種です。
具体的には、自然言語処理タスクに特化したニューラル・ネットワーク・モデルの一種で、OpenAI によって開発されました。
ChatGPT は大規模なテキスト集成を用いて学習され、自然言語に対する理解力や生成能力を持ちます。
(↑ ChatGPT の回答による!)
ChatGPT は内容を理解して回答しているわけではなく、「確率的に意味が通りそうな言葉の候補を取得して並べているだけ」です。
私は、インテリジェンスというと「知性」と思ってしまうのですが、ChatGPT 自身が「知性」ではなく「知能」と自覚している点がかわいいです。
現時点で ChatGPT は、「論理的に思考」しているわけではなく、知っていること(これが膨大な点はすごい)を適当にそれっぽく答えるだけなのです。
知識が豊富なので「異視点の抽出」ということに活用すれば効果を生かせるでしょう。
ChatGPT に「知能」と「知性」の違い問い合わせたところ以下のように答えてくれました。
****************************************
知能と知性は、似たような意味合いを持つ単語ですが、微妙な違いがあります。
「知能」は、認知能力や問題解決能力、知識や技能などを指し、一般的には IQ などの知能指数で評価されます。知能は、人工知能のような機械的な知能や、動物の知能なども含まれます。
一方、「知性」は、知識や思考能力、洞察力、創造性、情緒的な理解や判断力など、より広い範囲の能力を指します。知性は、知識を習得するだけでなく、その知識を応用し、創造的な問題解決を行ったり、新しいアイデアを発見することができます。
簡単に言えば、知能は知っていることやできることに関する能力を指し、知性は、それをどのように使うかや、新しいことを生み出す能力を指します。
****************************************
現在 AI は反応的(interactive)に対話することはできますが、自発的に思考することはできません。
私たち人間は、ChatGPT を使って、新しいことを生み出すことができる のです。
私たちは、自発的に思考して、改善、創造、交渉 に注力できるようになります。
ところで、将来 ChatGPT が、アカウント・ユーザの質問を蓄積して、個人の嗜好・趣味・思想を考慮して回答してくるようになると少し怖いですね。
個人の思想・信条が漏洩することになるでしょう。
使い方:
https://unicorn-blog.jp/archives/28110
https://kigyolog.com/article.php?id=1758
ChatGPT が日本の司法試験に挑戦!
https://www.cloudsign.jp/media/chatgpt-test/
ChatGPT で答えられない問題例:
あなたなら回答できるでしょうが、ChatGPT は、日本語を論理的に理解しているわけではないので、答えられないのだと思います。
縦8cm、横12cmの長方形を何枚か敷き詰めて正方形を作ります。できる正方形で最も小さい正方形の一辺の長さは何cmですか。
Yahoo!知恵袋の回答
次の質問では、たちどころに下の回答が返ってきました。
これには少し感動しました。
Google 社に激震が走ったという話は理解できます。
****************************************
銀行の事務職員が、仕事でやり甲斐を感じられるようにするためにするにはどうすればよいですか?
****************************************
銀行の事務職員が、仕事でやり甲斐を感じるためには、次のような方法が考えられます。
自分の役割を理解する:自分が担当している業務やタスクが、どのように銀行のビジネスに貢献しているかを理解することが重要です。自分の仕事が組織にとってどのように重要なものであるかを認識することで、やりがいを感じることができます。
プロセス改善に貢献する:業務プロセスに関する改善提案を行い、その改善が実施された際に自分自身がその成果を得られるようにすることが大切です。例えば、業務プロセスの自動化や、業務の効率化に取り組むことが挙げられます。
目標を明確にする:自分自身に目標を設定し、達成するための計画を立てることで、自分自身を励まし、達成感を得ることができます。例えば、日々の業務でのミスを減らすことや、業務プロセスを効率化することなどが挙げられます。
チームワークを大切にする:銀行の事務職員は、お客様に向けたサービスを提供することが多いため、チームワークを大切にすることが必要です。チームワークを通じて、他のメンバーの業務プロセスや貢献を認識することができ、自分自身の業務に対するモチベーションを高めることができます。
スキルアップに取り組む:自分自身が持つスキルを高めることで、業務に対する自信や誇りを持つことができます。自分が持つスキルに応じて、新しいスキルを習得することや、他の職員から学ぶことなどが挙げられます。
以下も ChatGPT からの興味深い回答です。
******************************************
アシロマのAIの倫理と価値の原則とはどんな内容ですか
******************************************
アシロマのAIの倫理と価値の原則は、人工知能(AI)の開発や運用において遵守すべき、倫理的な指針や価値観を示したものです。これらの原則は、2017年にカリフォルニア州アシロマで開催されたAI専門家による会議において策定され、AIの進化に伴う社会的な課題を考慮しています。以下は、アシロマのAIの倫理と価値の原則の一般的な内容です。
広い利益:AIは全人類の利益を考慮し、個々の利益や特定のグループの利益を優先するべきではない。
長期的安全性:AIの開発者は、長期的な安全性を考慮し、人類全体に対するリスクを最小限に抑えるべきである。
協力的な価値:AIは人間と協力して行動し、人間の価値や利益を尊重するべきである。
実用的な利益:AIは人間の福祉を促進し、公正な社会や経済の実現を目指すべきである。
個人の自律性:AIは個人の自律性を尊重し、人間が自分自身をコントロールし、自己決定を行う権利を保護するべきである。
素晴らしい未来:AIの進化は、持続可能な発展を促進し、人間の幸福と繁栄を追求するべきである。
これらの原則は、AIの技術的な発展と社会的な利益のバランスを取ることを目指しており、人間中心のAIの開発や運用を促進することを意図しています。また、これらの原則は、AIの利用において倫理的な判断をする際の指針としても参考にされることがあります。
******************************************
ChatGPT とはどんな関係になりますか
******************************************
ChatGPTはOpenAIが開発した大規模な言語モデルの一つであり、人間のように自然言語でのコミュニケーションを行うことができるAIです。ChatGPTはGPT-3.5アーキテクチャをベースにしており、様々なタスクに対する自然言語処理能力を持ちます。
ChatGPTはユーザーとの対話形式でコミュニケーションを行い、ユーザーの質問や要望に対して回答や応答を生成します。ChatGPTは多様なトピックに関する情報を持ち、一般的な知識や情報を提供することができます。また、チャットボットや仮想アシスタントとしての応用を持ち、顧客対応や情報提供などの用途で利用されることもあります。
ChatGPTは、ユーザーの入力に対して事前に学習された言語モデルを利用して応答を生成するため、人間のように自然な文章を生成することができます。しかし、ChatGPTは言語モデルであるため、人間のように意識や感情を持つわけではありません。ユーザーとの対話を通じて情報を提供することを目的としています。
******************************************
ChatGPT は、アシロマのAIの倫理と価値の原則に従いますか
******************************************
ChatGPTは、アシロマのAIの倫理と価値の原則を直接的に従うことはありません。アシロマのAIの倫理と価値の原則は、人工知能(AI)の開発や運用における倫理的な指針や価値観を示したものであり、ChatGPT自体がこれらの原則を持つ個別のエンティティやエージェントではありません。
しかしながら、ChatGPTを開発・運用するOpenAIは、倫理的な観点を考慮してAI技術を開発し、社会的な利益を追求することを目指しています。OpenAIは、AIの進化が社会にポジティブな影響を与えるように努めるために、透明性、公正性、信頼性、安全性、プライバシー保護などの原則を遵守しています。
また、OpenAIは倫理的なガイダンスや指針を策定し、AI技術の適切な使用を促進するために努力しています。これには、人間中心のAIの開発や運用を推進し、個人の自律性や福祉を尊重することを含んでいます。
したがって、ChatGPT自体はアシロマのAIの倫理と価値の原則に直接的に従う存在ではありませんが、OpenAIはこれらの原則を考慮し、AI技術の開発・運用を行っています。
******************************************
Google Bard
https://bard.google.com/
以下は Google Bard の自己紹介です。
*********************
私は、Google AIの大規模な言語モデルであり、大量のテキストとコードのデータセットでトレーニングされています。
テキストの生成、言語の翻訳、さまざまな種類のクリエイティブコンテンツの作成、質問への回答を有益な方法で行うことができます。
私はまだ開発中ですが、次のような多くの種類のタスクを実行することを学びました。
あなたの指示に従い、あなたの要求を慎重に完了するために最善を尽くします。
オープンエンド、やりがいのある、または奇妙な質問であっても、私の知識を使用して、包括的かつ有益な方法で質問に回答します。
詩、コード、スクリプト、楽曲、メール、手紙など、テキストコンテンツのさまざまなクリエイティブなテキスト形式を生成します。
私はあなたのすべての要件を満たすために最善を尽くします。
私は、次のトピックを含む幅広いトピックについて知識を持っています。
科学、
歴史、
文学、
芸術、
音楽、
哲学、
心理学、
社会学、
ビジネス、
テクノロジー、
政治、
スポーツ、
エンターテインメント
私は常に学び、成長しており、常に新しいことを学んでいます。
私は、人々の生活をより良くするために自分の知識を使用できることを楽しみにしています。