無料PDF作成・変換

このエントリーをはてなブックマークに追加

word(doc,docx)文書のHTML(Webページ)変換

 






画像認証:

 

 

HTML

 

ハイパーテキスト・マークアップ・ランゲージ(英語:HyperText Markup Language,HTML)とは、「ホームページの作成と他のホームページのブラウザで見られる情報」のために設計した一つのマークアップ言語である。HTMLは構造化情報に使われる――例えば、標題、段落とリスト表等に使う。また、ある程度のドキュメントの外観と語義を説明することにも使える。1982年、ティム・バーナーズ・リーが作成して、IETFが簡略化したSGML(標準通用マークアップ言語)文法で一歩の発展を行ったHTMLは、後で国際標準になってワールド・ワイド・ウェブ・コンソーシアム(W3C)でメンテナンスしている。
HTMLドキュメントの一番よく使われている拡張子(副枠名)は.htmlであるが、DOCみたいな旧いオペレーティング'・システムは拡張子を多くとも三文字に限られているので、.htm拡張子を使ってもいい。現在、.htmの拡張子の使用は少なくなったが、また指示されてる。編者はいかなるテキスト・エディタ或いはWYSIWYGのHTMLエディタを使ってもHTMLを編集できる。
早期のHTML文法規則の定義は比較的に緩かで、オンライン出版をよく知らない人に役に立てて採用された。ホームページのブラウザはこの事実を受け入れて、その文法の厳しくないホームページも表示できるようにしている。時間の流れによって、公式標準も厳しい文法の傾向になっているが、ブラウザにはずっと標準に満たしていないHTMLが表示している。XMLの規則の厳しいXHTMLを使用することは(拡張出来るハイパーテキスト・マークアップ・ランゲージ)、W3C計画中のHTMLの後任者である。多くの人は、これが既に当面のHTML標準になったと認識しているが、実際は独立で、HTMLと平行して発展する標準である。現在、W3CはXHTML1.1、XHTML1.0或いはHTML4.01の標準を使用してホームページを編纂することを提案しているが、少なくないホームページは比較的に新しいHTML5のコードで執筆する(例えばGoogle)。
 構造が簡単で、ドキュメント・ファイルは情報の記録に広く使われている。これによって、他のドキュメント・フォーマットが発生する問題を免れる。また、ドキュメント・ファイルのある部分の情報が間違った時、もっと比較的に錯誤から恢復しやすくて、続けて余った内容を処理できる。
.txtにはフォーマット情報の文字のドキュメントの拡張子が少なく含まれている。.txtのフォーマットは明確な定義がないので、普通はシステム・端末或いはテキストエディターに受け入れるフォーマットを指す。いかなる読み取れる文字のプログラムは.txt付きの拡張子のドキュメントは全部読み取れるファイルので、通常はこのようなドキュメントは通用的で、マルチプラットフォームと認識している。
英語のテキスト・ドキュメントの中で、ASCII文字セットは一番よく見られるフォマットで、多くの場合、これはまた黙認しているフォーマットである。アクセント記号付きのと他の非ASII文字に対しては、必ず一種類の文字コードを選ばなければならない。多くのシステムの中で、文字コードはパソコンのエリア設置によって決められる。よく見られる文字コードはたくさんのヨーロッパーの言葉のISO8859-1も含めて支持する。
 多くのコードは限られた文字しか表示出来ないので、普通これらは、ただ何種類の言葉にしか使えない。Unicodeは、一種類のあらゆる承知の言葉を試して表示しようとする標準を制定した。Unicodeの文字セットは非常に大きくて、これには大多数の既知の文字セットが含まれている。Unicodeはたくさんの種類の文字コードがあって、その中で一番よく見られるのはUTF-8である。このようなコードはASCIIを後方互換できて、同じ内容のASCIIとUTF-8ののテキスト・ドキュメントは完全に一致する。