logo
繁体
繁体

这家公司用大数据分析来寻找儿童喜欢的动画角色,结果让人大吃一惊


一只在混乱时空旅行的名叫“Hoot”的猫头鹰,是新童书《时间伙伴》的主角,在线阅读平台Epic上这本书正在打破纪录。

华尔街日报报道说,上周,这本数字漫画书在发行的前五天就超过了100万次阅读量。Epic也做出了同样的预测。这本书之所以在6至10岁的孩子中大受欢迎,部分原因是网站上孩子们的偏好和阅读习惯。

当孩子们用黏糊糊的手指寻找要读的东西时,Epic会捕捉到这个活动,并将信息输入到它的图书推荐引擎中——这个工具也会通知内部可以创建一本新图书。

Epic的团队知道孩子们喜欢猫头鹰胜过鸡,喜欢鸡胜过刺猬。孩子们寻找独角兽的频率,几乎是寻找美人鱼的两倍。火山比海啸更受欢迎,海啸比地震更受欢迎。

泰坦尼克号比牛仔还要火,披萨比蛋糕还要受孩子关注,科学比艺术更值得摸索,而“便便”,比所有这些都重要。

在大流行期间,Epic的覆盖范围增加了一倍多,全球有5000万儿童用户,其中大部分在美国。 这家成立于2013年、总部位于加州红木城的在线订阅童书服务,对学校免费,并通过提供易于访问的图书和教育视频库,成为全美各地偏远教室的宝贵固定资产。

Epic现在拥有大量关于儿童的数据,而这个群体是出了名的难以追踪。但是这家公司可以获取实时数据,包括有多少孩子阅读了一本书,他们阅读的时间有多长,他们拿起或放下书的频率有多高,以及他们的兴趣何时开始减退。

Epic表示,它的数据是匿名和聚合的,这意味着它是在更大的群体中进行研究,而不需要为个别儿童提供识别信息。不过监管组织对隐私以及收集儿童数据这一特别棘手的问题提出了担忧。

每当孩子翻开屏幕上的一页,或者在Epic的搜索栏中输入一个单词,该网站就会收集数据。该公司从主要出版商那里获得了4万种数字图书的授权,利用这些数据定制阅读推荐。

Epic表示,这些搜索所获得的信息不会与图书行业的其他部门共享,但它们也可以在Epic不断扩大的150多本原创图书的情节、人物和背景中发挥作用。

从今年春天开始,Epic原创的几个印刷版将在沃尔玛、塔吉特和山姆俱乐部的最佳位置出售,即便是以传统出版标准衡量也是如此。


Epic联合创始人多纳休(Kevin Donahue)表示,“仅去年一年,我们就有5000万儿童阅读了10亿本书籍,我们可能对儿童喜欢读什么有非常独特的见解。我们正努力吸引那些愿意回来并期待这款游戏的用户。这是我们从电视和流媒体世界中抢到的东西。我们可以说,用书本可以做到。’”

传统的儿童图书出版商认为,过度依赖搜索分析,将导致故事失去讲故事的魔力。举个例子,玛格丽特·怀斯·布朗的研究表明,孩子们喜欢太阳甚于月亮,那她1947年的经典作品《晚安月亮》应该被称为《晚安太阳》吗?

“我们不仅仅是在追随潮流,”哈珀柯林斯儿童图书公司总裁兼出版人墨菲(Suzanne Murphy)说,“我们在创造潮流。”

主流出版商利用销售数据和其他类型的数据分析,对儿童书籍进行市场和研究,也会最临时出版与重大事件相关的即时图书。但这个行业仍然严重依赖作者和编辑之间创造性的内容交换,以及焦点调研小组和与图书馆员之间的市场情报关系等长期来源。

部分儿童图书行业的收入依赖于之前出版的图书的销售。企鹅兰登书屋儿童部总裁兼出版人马库斯(Barbara Marcus)说,该出版社最销售的十本书中,大约有七本是旧书,而不是新书。

“我们出版我们想让孩子读的书,然后他们读给他们的孩子听,再读给他们的孙子听,”马库斯女士说。

Epic的原创书目系列于2018年推出,包括在笔记本电脑、手机和其他设备上提供的漫画、图画书和图形小说。《猫忍者》是该公司迄今为止最受欢迎的数字系列,在过去两年里有超过7000万的阅读量,并获得了业内网站的热情评论。

去年秋天,《猫的忍者》第七本书在 Epic 平台上登载了一张猫头鹰助手的封面照片,新角色名叫Hoot,是一个新的超级英雄,特点是两个大眼球和翅膀。结果阅读量在一周内飙升至35万,是该系列前几本书平均阅读量的两倍多。这些点击率引出了在Epic的内部作家室版本中构思的,五本Hoot系列。

“我们创造内容,读者回应,我们回应他们的回应,”维纳博(Colleen AF Venable)说。故事背景设定在史前时代,接下来的几部计划讲述古埃及、海盗时代、流行搜索词、文艺复兴和极地探险时代。

网站上最近的数据,提供了一个对儿童群体思维的有趣的机会。该公司表示,搜索者主要是12岁以下的儿童,其中大多数可能是6岁至12岁的儿童。

在孩子们最常搜索的动物排名中,猫头鹰的排名高于考拉,蠕虫的排名高于袋鼠,凶猛的野兽有一群忠实的粉丝,脾气暴躁的水滴鱼也是如此。最受欢迎的动物名单也令人挠头——比如,为什么其中包括会扎人的昆虫,而没有大熊猫?


Epic指出,榜单会随着季节、学校教学内容和文化活动的变化而变化。

搜索词数据的整个类别被称为“gross”。在相当诡异的名单上,51区(注,美国人认为政府藏着外星人的地方)的搜索量几乎和僵尸一样多。在历史人物中,林肯的地位高于富兰克林,淘金热压倒波士顿倾茶党,哈丽特·塔布曼胜过海伦·凯勒和杰罗尼莫。

大流行的压力在孩子们身上显而易见,“冠状病毒”和“细菌”得分高于“瑜伽”和“锻炼”。

在最近的一系列在线头脑风暴中,在原创内容总监埃里克·怀特的带领下,工作人员即兴为未来的Hoot情节出谋划策,随意挥散想像力,豚鼠成群结队地旅行,谁知道呢;要努力澄清故事线,如果鸡被命名为蒙娜丽莎,会不会很混乱;并努力解决古埃及的身份政治问题,以猫为反派,我们是不是会陷入文化之争?

公司高管说,大部分的过程与其说是科学,不如说是艺术。作者和编辑都是在大型出版社工作过的老手,他们的想象力比任何机器学习都更能影响决策。尽管如此,数据仍然可以作为新想法的跳板,就像当我们需要寻找未来的热门角色时一样。

动物排名的电子表格出来了。

“臭虫的排名比鳄鱼还高,”一位作者浏览着一篇专栏文章说。

“孩子们有没有搜索过河马?”

并没有。

“蛇是相当高的,”一个同事道,想象着一条蛇形眼镜蛇处于攻击位置,它的兜帽像斗篷一样张开。

一支由圣甲虫组成的英雄队伍呢?

可能。想像一个他们的名字是约翰,保罗,乔治和林戈?


非营利组织,常识媒体(Common Sense Media)对Epic的评级系统发出了“警告”,这个组织隐私项目的负责人凯利说,部分原因是该网站在数据收集和使用方面缺乏透明度。

该组织对事关儿童的技术和娱乐进行评级,给出通过、不及格或警告评级。由于在儿童隐私方面缺乏明确性或有问题的做法,这个机构给三分之二的受调查教育平台贴上了警告标签。

曾任YouTube内容副总裁的多纳休说,Epic不展示第三方广告,采用行业标准的加密技术来保护学生数据,也不将学生信息用于广告或营销。他说,该公司正在解决常识媒体组织对其隐私披露的担忧。

在大流行期间,Epic允许任何学生在老师的邀请下在家免费使用其图书馆,并允许普通公众免费使用限量版。2013年至2020年期间,Epic从投资者那里筹集了6000万美元,每月订阅费用为9.99美元。

随着《时间伙伴》的开拍,这是今年推出的60部原创影片之一,Epic的员工们正在寻找新的创意。

“如果我们写一本恐龙骑鲨鱼的书,”怀特说,“也许我们就可以退休了。”