OpenHarmony 啃论文成长计划——为什么 JSON 将逐渐取代 XML?(中篇)(转载)

OpenHarmony 啃论文成长计划——为什么 JSON 将逐渐取代 XML?(中篇)(转载)

作者简介

HagonChan,陈汉武,来自深圳技术大学的大二学生。目前在学校FSR实验室学习OpenHarmony及HarmonyOS北向应用开发、web以及小程序前端开发以及区块链智能合约开发,具有小程序开发经验。从上一个寒假开始正式投入到鸿蒙系统的学习中,后续仍会持续投入精力继续深入学习。目前正在参加OpenHarmony“啃论文”的成长计划,并输出过学习博客,得到广大开发者的好评。FFH是FSRlab For Harmony的首字母缩写。

本期看点

  • 标记型语言和XML的起源
  • JSON的起源
  • XML与JSON的数据对比

引言

相信大家不管是在OpenHarmony应用开发,Web开发或者小程序开发,都会用JSON或者XML进行数据的传输,大家对这两个技术的使用并不陌生,但是我们往往只是局限在使用上,所以在阐述为什么XML会被JSON取代之前,我想先把这两个东西的起源和由来都给大家简单的科普一遍。

第一章 XML

XML是可扩展标记语言(eXtensible Markup Language)的缩写,特点如下:

  1. 具有平台无关性,是一门独立的标记语言。
  2. 具有自我描述性。

.XML文件是保存XML数据的一种方式,但是不要狭隘理解为XML语言一定会保存为.XML文件。XML数据也可以以其他的方式存在,比如在内存中构建XML数据。1.1 标记型语言讲XML之前,我们先来了解一下标记型语言,我就用通俗地语言描述一下,比如我现在要写一篇博客告诉你们为什么XML会被JSON取代,那这篇博客里面会有标题,二级标题,代码段,高亮文本等等,这些最终都会显示在网站上。那么问题来了,浏览器怎么知道我显示的文字是标题还是高亮文本?于是就有了Markdown这门标记语言,它就是用各种标记符号说明了哪里是标题,哪里是高亮文本。说白了,标记语言就是为了让冗杂的数据结构化,使用标记语言后,能让计算机和人能清晰辨别各类数据。比如下面这个例子,用#来标记一级标题,“内可以放高亮文本。比如网页能按照标题,段落,图片呈现,都得归功于标记型语言HTML(HyperText Mark-up Language,超文本标记语言)。

1.2 XML的起源
最早在1969年,IBM开发了第一种文档描述语言,用来解决不同系统中文档格式不同的问题,把这种标记语言称为通用标记语言GML(Generalized Markup Language),后面这门语言也被不断改进。GML(1969)——>SGML(1986 国际标准化组织采纳)——>SGML(2018改进并完善)SGML(Standard Generalized Markup Language,标准通用标记语言)具有相当高的规范性和可扩展性,但是就是因为规范多,导致开发,学习,维护的成本很高。到了1989年欧洲粒子物理实验室的研究员在SGML的基础上,提出了HTML,一种超文本的标记语言,简单、通用,语法要求宽松(可以嵌套使用)。然后随着web的发展,传输过程中负载的数据量越来越大,如果没有结构化数据的话,处理传输的数据消耗会非常非常大,而且非常麻烦,而HTML重点是对于数据的显示,不关心所描述的数据结构,缺乏对文档数据含义的确切描述,不能满足对各类信息的存储,传递和搜索的需求,基于以上需求,又一次在SGML的基础之上,简化出一种规范,1996年,提出了另一种标记型语言命名为XML(可扩展标记语言),就这样,XML出现了。1.3 XML示例

比如A公司要获取到B公司名字叫Hagon的员工个人信息,这时B公司接受到A公司的请求后,就给A公司传输发送了如下XML格式数据:

因为结构清晰,A公司拿到数据后很方便地进行了处理。

1.4 XML的瓶颈虽然XML标准本身简单,但与XML相关的标准却种类繁多,W3C(World Wide Web Consortium,万维网联盟)制定的相关标准就有二十多个,采用XML制定的重要的电子商务标准就有十多个。随着AJAX(Asynchronous JavaScript And XML,异步JavaScript和XML的首字母缩写。之前叫XMLHTTP,2005年后才叫AJAX)技术的流行,XML的弊端也越来越显现:大家都知道XML实现是基于DOM(Document Object Model,文档对象模型)树实现的,而DOM在各种浏览器中的实现细节不尽相同,所以XML的跨浏览器兼容性并不好,所以急需一种新的数据负载格式集成到HTML页面中以满足AJAX的要求。这就到了我们要讲的JSON。

第二章 JSON

2.1 JSON的起源

前面我们说了随着AJAX的流行,而各种浏览器对DOM的实现细节不尽相同,所以会出现兼容性问题,这对前端开发同学来讲真的是灾难。因为一个功能可能需要用代码去兼容各种不同的浏览器,还要调试,工作量巨大。

但是问题总有办法能解决,那就利用所有主流浏览器中的一种通用组件——JavaScript引擎。这样只要创造一种JavaScript引擎能识别的数据格式就可以啦!

然后就诞生了JavaScript Object Notation (JSON)。它是一种轻量级的、基于文本的、独立于语言的数据交换格式,它源于ECMAScript(European Computer Manufacturers Association Script,欧洲计算机制造商协会脚本)编程语言标准。2.2 JSON示例也是上一个员工信息的例子,用JSON就可以表示为:

第一点可以看到,可以看到没有像XML一样有太多嵌套的标签,都是以类似键值对的形式表示,结构简单。

第二点,在编写XML时,第一行需要定义XML的版本,而JSON不存在版本问题,格式永远不变。

第三章 XML与JSON的数据对比

说了那么多纸上的白话,接下来用数据说话。
3.1 场景介绍场景由一系列较小的试验组成,这些试验根据我们的每一项指标来确定JSON和XML在统计上是否不同。采用均值比较消耗时间检验。我们将20000、40000、60000、80000和100000个编码对象发送到服务器,并收集每种情况的指标。表3、4和5显示了从这些试验中获得的指标。

表3对比了JSON和XML的时间消耗。从这张表格上,不难看出XML处理相同数据的时间消耗大约是JSON的30倍。表4/图4和表5/图5分别是JSON和XML的CPU和内存利用率数据显示,从左到右依次是用户CPU利用率的平均百分比,系统CPU利用率的平均百分比和内存利用率的平均百分比。说明了JSON的资源利用率和XML的资源利用率之间的差异。上图数据表明,XML使用的用户CPU利用率整体上明显低于JSON。JSON和XML编码的传输在服务器上使用的内存量几乎相同。

3.2 对比总结

在上面的实验数据可以看到,JSON的性能明显强于XML。它们之间的详细对比参见如下表格:

XML与JSON在Web不断发展且传输数据量日益增大的背景下, 在要求算力的时代下,JSON毫无疑问会是更加优秀的一方。并且现在也又很多JSON的解析器,比如Gson(Google 提供的用来在 Java 对象和 JSON 数据之间进行映射的 Java 类库),FastJson(这是阿里巴巴开源的一个JSON解析库,可以将Java对象转换为JSON格式,当然它也可以将JSON字符串转换为Java对象),Jackson(这是目前使用非常广泛的JSON生成和解析工具)等,这些解析器也在不断助力JSON的发展。

全文缩略语汇总

缩写英文中文
RPCRemote Procedure Call远程过程调用
HTTPHyperText Transfer Protocol超文本传输协议
TCPTransmission Control Protocol传输控制协议
UDPUser Datagram Protocol 用户数据报协议
URIUniform Resource Identifier统一资源标志符
JSONJavaScript Object Notation
PHPHypertext Preprocessor超文本预处理器
SOAService-Oriented Architecture面向服务架构
NIONon-blocking Input Output非阻塞式的输入和输出
FAFeature Ability特性能力
HTMLHyperText Markup Language超文本标记语言
XMLEXtensible Markup Language可扩展标记语言
SDKSoftware development kit软件开发套件
GMLGeneralized Markup Language通用标记语言
SGMLStandard Generalized Markup Language标准通用标记语言
W3CWorld Wide Web Consortium万维网联盟
AJAXAsynchronous JavaScript And XML异步JavaScript和XML
DOMDocument Object Model文档对象模型
ECMAScriptEuropean Computer Manufacturers Association Script欧洲计算机制造商协会脚本

前期回顾

OpenHarmony啃论文成长计划—JSON-RPC(上篇)

后期预告

OpenHarmony啃论文成长计划—几种常见的JSON解析器比较(下篇)

参考文献

[1] Comparison of JSON and XML data interchange formats: A case study

[2] The application/json Media Type for JavaScript Object Notation (JSON) – 百度学术 (baidu.com)

写在最后

OpenHarmony 成长计划—“啃论文俱乐部”(以下简称“啃论文俱乐部”)是在 2022年 1 月 11 日的一次日常活动中诞生的。截至 3 月 31 日,啃论文俱乐部已有 87 名师生和企业导师参与,目前共有十二个技术方向并行探索,每个方向都有专业的技术老师带领同学们通过啃综述论文制定技术地图,按“降龙十八掌”的学习方法编排技术开发内容,并通过专业推广培养高校开发者成为软件技术学术级人才。

啃论文俱乐部的宗旨是希望同学们在开源活动中得到软件技术能力提升、得到技术写作能力提升、得到讲解技术能力提升。大学一年级新生〇门槛参与,已有俱乐部来自多所高校的大一同学写出高居榜首的技术文章。

如今,搜索“啃论文”,人们不禁想到、而且看到的都是我们——OpenHarmony 成长计划—“啃论文俱乐部”的产出。

OpenHarmony开源与开发者成长计划—“啃论文俱乐部”学习资料合集

1)入门资料:啃论文可以有怎样的体验  

https://docs.qq.com/slide/DY0RXWElBTVlHaXhi?u=4e311e072cbf4f93968e09c44294987d

2)操作办法:怎么从啃论文到开源提交以及深度技术文章输出https://docs.qq.com/slide/DY05kbGtsYVFmcUhU  

3)企业/学校/老师/学生为什么要参与 & 啃论文俱乐部的运营办法https://docs.qq.com/slide/DY2JkS2ZEb2FWckhq

 4)往期啃论文俱乐部同学分享会精彩回顾: 

同学分享会No1.成长计划啃论文分享会纪要(2022/02/18)  https://docs.qq.com/doc/DY2RZZmVNU2hTQlFY  

同学分享会No.2 成长计划啃论文分享会纪要(2022/03/11)  https://docs.qq.com/doc/DUkJ5c2NRd2FRZkhF  

同学们分享会No.3 成长计划啃论文分享会纪要(2022/03/25) 

https://docs.qq.com/doc/DUm5pUEF3ck1VcG92?u=4e311e072cbf4f93968e09c44294987d

现在,你是不是也热血沸腾,摩拳擦掌地准备加入这个俱乐部呢?当然欢迎啦!啃论文俱乐部向任何对开源技术感兴趣的大学生开发者敞开大门。

后续,我们会在服务中心公众号陆续分享一些 OpenHarmony 开源与开发者成长计划—“啃论文俱乐部”学习心得体会和总结资料。记得呼朋引伴来看哦。

扫码添加 OpenHarmony 高校小助手,加入“啃论文俱乐部”微信群

简体中文