影视聚合站 科技 文章内容

如果把14亿中国人都拉到一个微信群。。。

发布时间:2021-06-01 20:54:20来源:程序员专栏

关注后回复“进群”,拉你进程序员交流群

来源丨人工智能爱好者社区

“最近,知乎上有一个非常热门的问题:“把14亿中国人民都拉到一个微信群里在技术上能实现吗?”

先说结论:也许可以实现,但你会什么都看不见。

根据2017年《微信数据报告》的公开数据[参考1]:2017年9月,微信日均登陆9.02亿人,日均发送消息380亿次。

这意味着平均每人每天发送信息42条,如果全国人民(对了,现在全国人口已经接近14亿)在同一个群里说话,这个群每天出现的信息就高达:

这么多信息仅仅是匀速发送的话,考虑到大家的睡眠,睡觉的8小时不算,那么手机里每秒要接收的信息就是:

哇塞,每秒超过100万条啊!目前主频最高的手机CPU之一,高通骁龙845有2.8GHz的处理能力[参考2],一共是8核。

如不计算安卓系统、显示刷新、网络IO等CPU操作的话,每条信息能分配到的计算能力是:

这是什么概念?全球第一款微处理器是1971年英特尔推出的Intel4004[参考3],这个老古董的主频也有108KHz啊。所以21.9KHz就是啥也干不了。

幸好IT界有个摩尔定律:每18个月CPU性能就能翻倍(或者价钱是一半)。虽然现有科技已经很难让主频提升(某牙膏厂拼命挤也只有5Ghz)。

但假设我们使用了黑科技提升主频。等到了2025摩尔定律失效时[参考4],我们的手机CPU主频应该达到:

看起来不错嘛,不过每条消息能得到的计算能力将达到:

呵呵,依然没有达到Intel4004的水平,所以结果就是你等了7年,还是进不了这个全国群抢一个红包。

好吧,咱们让手机接入一个给力点的电脑,比如说全球超算第一名的太湖之光,1千万个CPU核心[参考5]来帮忙处理这个宇宙第一大微信群。算力的问题总算有了着落。

我们假设平均每条消息有10个汉字,这大概相当于30byte,算上应用层会加上一定的控制字符,再加上TCP/IP网络层的数据消耗大概是74byte,取个整,平均每条消息有100byte,每个byte相当于8个bit。

这时每秒需要的网络带宽大约是:

如果有人发红包,需要的带宽就更大了。

理论上,4G网络能支持1000Mbps[参考6],但别忘了,是全国人民在同一个群里,而你周围的人也需要同样的带宽,这使得你附近的基站不堪重负,陷入瘫痪。

为了避免网络瘫痪导致你抢不到红包或者看群消息,你需要搬到一个周围没有人的基站,比如放暑假了全校只有你还没回家的时候。

不过运营商的日子就不好过了,因为这一秒全国上下的流量就达到了惊人的:

这相当于2017年4月份的全国移动数据总流量的65.7%[参考7],意味着每18秒就能用完全国一年的流量。运营商瑟瑟发抖.gif

如果把1.146Ebit数据用2TByte3.5英寸硬盘(20mm高)装起来,然后叠起来,有1433.25m,相比之下,全球最高楼——迪拜的哈里发塔只有区区828m。

当然,如果确实有需要,我相信电信运营商们肯定砸下重金为你建设全世界最大的宽带网络。

不过,接下来该花钱的就不是运营商——而是腾讯了。

为了处理这1.146Ebps的流量,腾讯需要准备11466万套交换机和服务器。

目前一台大厂4口万兆交换机售价大约是4000元,一台便宜带万兆口的服务器则大概需要10000元,这两项加起来的费用是:

呃,仅仅这两项就相当于深圳2014年全年的GDP[参考8]。

这里还不包括网线、电线、服务器机架、机房托管、电费、运行支出……

这么多设备的存放也是个问题。一台带万兆(10Gbps)口的2U服务器有88.9mm高,这样叠起来就有:

这差不多是中国到美国的飞机航线距离啊,用来修铁路也是够够的了。

好了,有了这么多设备加持,这下你终于可以愉快地进了群。

但你惊讶地发现,屏幕上除了白色,什么都没有——这是因为你的眼睛没办法接收这么快的数据!

人眼的视觉暂留时间是100-400毫秒[参考9],而我们这个群每秒钟就要显示102万条信息,每条消息停留的时间只有大概0.001毫秒。相比之下,电影、电视都有41毫秒。

因此你还没来得及看清消息,它就已经消失了,最后只留下一团白色的色块在屏幕的正中央。

@大哥有柔情:

14亿在一个群并不可怕。可怕的是,每逢节日群里都会让群主发红包!

@后知后觉:

已经做到了,14亿人拉到一个微信群,大家看到的都是新闻联播。

@bluecat:

简单的说,你的手机会马上崩溃,因为它承载不了一秒钟的信息量。

@三毛鱼

可以实现,不过要加几条限制:

①所有微信账号强制加入到这个微信群。

②微信群只能有限的几个人发言,其他人不能发言。

③微信群里只能在每天固定时间段发消息。

④其他微信群在固定时间不能发消息,或者只能转发这个微信群的消息。

这样就可以实现了,技术上没有难度。

@程墨Morgan

“拉”到一个群里没啥不难实现的,反正用户信息都在服务器上,建一个包含所有用户微信号的群也就是添加一个记录而已。

但是,这个群千万不要让任何人都能发言,就以我国人民的多样性,各种话唠、贴图狂人、广告狂人......海量信息瞬间就可以把服务器、运营商网络和你手机的电池击溃。

@世安先生

讲真,单从理论上来说目前的技术还是可行的,咳咳,我要装逼了。

看了别的答主的回答,说人、终端、传输、处理、存储、分析等等各方面均有缺陷或者短板,跟不上大批量的数据,其实个人觉得实施起来也还是有得搞的,只是成本和利润之间的关系罢了。

首先,得考虑人的因素,多少多少亿的信息量对于某个特定个体来说价值无限接近于0,我个人根本不关注这些信息,因为获取信息的效率太低了。

这就导致了百分之九十九的人直接忽略了这个群的存在,剩下的每天这个群里的消息无非就是置顶公告,置顶新闻,红包和闲聊斗图,浏览公告和新闻。

考虑到并发的问题,一般现在的服务器都可以做到,毕竟有大把的新闻App都可以做到;红包,做个算法随机分配吧,也别抢了,抢会严重影响体验,给十亿用户随机分配一段数据应该难度也不太大。

剩下的就是斗图闲聊,数据直接云存储在服务器端,分析处理总结出来个中心思想每多少秒多少秒推送给个人用户一次,就差不多了,需要详细信息的上服务器检索,个人觉得对个人终端的压力也不会太大。

其次,传输,这是我觉得问题最小的一个环节,为什么呢?解决了个人终端的问题之后,个人的数据传输量并不大,现有的传输网络完全可以满足。

服务器端的传输,要看这服务器怎么个建法,如果集中式处理和存储,就只能用百G专线,建个三五条完全够了。

只不过相应的配套交换机路由器要建一套庞大的系统出来。如果是分布式存储和处理,10G的甚至GE的专线都够。这是传输。

第三,处理,如果非得把大批量的数据集中处理,就得建设一套国内最大甚至世界最大最复杂的数据中心才能够承载这套系统。

但是如果分布式处理的话,我相信现在的系统也够用,毕竟现有的运算量已经这么大了,而有这个群之后数据量也绝对不会爆炸式增长。

第四,存储,处理的工作能够完成存储肯定也不是问题,甚至可以将数据破碎后存储在个人终端上,将投资设备的矛盾转嫁到数据安全和管理上。

第五,数据分析,这一点才是重中之重,难点中的难点,如何有效的分析提取如此大量数据中的有用信息并推送给特定的个人才是核心关键。

虽然现在技术还没有大面积商业化,但我相信这种技术是肯定已经有试用的甚至是已经商用的存在了,只不过公众不太清楚而已,毕竟这种东西仔细想想还是有点恐怖的。

总之,如何实现这个系统或者说建好这个群,无非就是做好需求与资源之间矛盾的转嫁,把存储需求量大与投资大之间的矛盾转嫁到数据安全与运营管理上,把大数据量传输分散化,把大量的数据进行分析提取后定向推送,最核心的投资也就是整套智能有效的大数据分析系统。

(ಥ_ಥ)不过……话说这么搞的话不就是搞了个有14亿关注量的公众号嘛…d(ŐдŐ๑)好了,我装逼装完了,你们打的时候下手轻点,别拿砖头,别提40米青龙偃月大关刀......

-End-

最近有一些小伙伴,让我帮忙找一些面试题资料,于是我翻遍了收藏的5T资料后,汇总整理出来,可以说是程序员面试必备!所有资料都整理到网盘了,欢迎下载!

点击卡片,关注后回复【面试题】即可获取

在看点这里好文分享给更多人↓↓

© 2016-2017 ysjhz.com Inc.

站点统计| 举报| Archiver| 手机版| 小黑屋| 影视聚合站 ( 皖ICP备16004362号-2 )