美篇是南京蓝鲸人网络科技有限公司的主要产品,主打朋友圈的图文创作分享,定位为“不惑后”表达自我、结交同好、学习提升的互联网内容社区。美篇自 2015 年 7 月正式上线以来业务快速发展:
用户量快速增长:用户规模快速增长,累计注册用户 2 亿,创作用户突破 4000 万,APP 月活跃用户 1200 万;
海量内容沉淀:美篇作为一个强大的兴趣内容社区,日新增作品 18 万,拥有海量 UGC 图文&视频内容沉淀;
多产品功能上线:话题热榜、线上课堂、笔友书信等内容。
这也使得应用平台承载信息量大幅上升,应用程序运行难度加大,稳定性受到一定威胁。
对于移动 APP 的开发者来说,最基础也是最关注的就是应用程序的稳定性及用户体验。崩溃问题和卡顿更是影响应用稳定性及用户体验的关键因素,比如 Java 崩溃、Native 崩溃、ANR,卡顿等类型问题。随着美篇产品功能的丰富及用户量的快速增长, OOM 及卡顿问题的优化和处理也日益重要。
APMPlus 是火山引擎应用开发套件 MARS 下的性能监控产品,为企业提供全链路的应用性能监控服务,助力企业提升异常问题排查与解决效率。
基于海量数据的聚合分析,平台可帮助客户发现多类异常问题,并及时报警,做分配处理,同时平台提供了丰富的归因能力,包括且不限于异常分析、多维分析、自定义上报、单点日志查询等,结合灵活的报表能力可了解各类指标的趋势变化。APM Plus 应用性能监控已服务了抖音、今日头条等多个超大规模用户量级移动 APP。
APMPlus 丰富的能力满足了美篇 APP 全面性能监控的诉求:
针对稳定性问题,MARS-APMPlus 提供了Java 崩溃、Native 崩溃、ANR 等不同异常类别监控,抓取成功率高,归因异常丰富;
针对性能问题,提供启动监控,页面监控,卡顿监控等流畅性类的监控,以及内存、CPU、电量等资源消耗问题的监控;
另外提供网络耗时和异常监控,以及强大的单点分析和日志回捞能力分析单点问题。拥有事件自定义上报进行个性的打点监控,强大的看板进行多维度展示;
数据采集提供采样和开关配置满足用户对数据量和成本的诉求,同时提供基础的报警能力对异常问题实时报警;
针对跨平台方案提供 WebView 页面和 Flutter 监控。
方案亮点:
Java OOM 监控提供全流程自动分析能力,准确定位 Java 内存问题。泄漏链、泄漏大小一目了然;
ANR使用基于信号的捕获方案,更节省系统资源,准确度高,唯一做到提供现场消息调度图,高度还原现场主线程阻塞情况;
做到真正解决 Native(C/C++) 崩溃的现场还原能力,提供了最有价值的 Tombstone,精细还原现场。完整展示崩溃线程的进程信息、信号信息、寄存器信息,还原崩溃现场汇编指令,详细的maps,fd 和内存信息;
提供了高性能日志库,做到数据稳定性强、性能好,保障了现场业务信息的高度还原。
美篇通过使用 MARS-APMPlus 应用性能监控产品,并实施相应解决方案后,效果非常明显,应用程序的性能稳定得到了显著提升:
Android Java OOM 降低了 80% 以上,从 8 月份的 1.5% 降低到 12 月底的 0.1%;
Android 用户卡顿率降低了 80% 以上,Android 用户卡顿率从 8 月份的 11% 降低到 12 月底的 2%;
iOS OOM 降低了 80%+,从 8 月份的 1.3% 降低到 12 月份的 0.2%;
iOS 卡顿率降低了 90%+,从 8 月份的 1.1% 降低到 12 月份的 0.1%。
OOM下降
卡顿下降
MARS-APMplus 除了支持对 APP 进行性能监控,也支持对 SDK 进行性能监控。MARS-APMPlus 为企业提供针对应用服务的品质、性能以及自定义埋点的 APM 服务,帮助团队打造极致的用户体验。