- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我提出这个问题是为了寻求有关如何设计系统的实用建议。
像 amazon.com 和 pandora 这样的网站拥有并维护着庞大的数据集来运行他们的核心业务。例如,亚马逊(以及所有其他主要电子商务网站)有数百万种待售产品、这些产品的图片、价格、规范等。
忽略来自第三方卖家的数据和用户生成的内容,所有这些“东西”都必须来自某个地方并由某人维护。它也非常详细和准确。如何?他们是怎么做到的呢?是否只有一大群数据录入员,或者他们是否设计了系统来处理繁重的工作?
我公司也有类似情况。我们维护着庞大的(百万条记录中的 10 条)汽车零件目录及其适用的汽车。我们已经这样做了一段时间,并提出了许多程序和流程来保持我们的目录不断增长和准确;但是,似乎我们需要将目录增加到 x 个项目才能将团队增加到 Và。
我需要想出一些方法来提高数据团队的效率,希望我可以从其他人的工作中学习。感谢任何建议,但更多的是指向我可以花一些认真时间阅读的内容的链接。
câu trả lời hay nhất
使用访问者。
即使您每个项目都有一个人,也会有错误的记录,客户会找到它。因此,让他们将项目标记为“不合适”并发表简短评论。但别忘了,他们不是你的员工,不要对他们要求太多;看看 Facebook 的“喜欢”按钮,它很容易使用,并且不需要用户花费太多精力。良好的性能/价格。如果 Facebook 中有一个必填字段,询问“你为什么喜欢它?”,那么任何人都不应该使用该功能。
访问者还可以帮助您隐含方式:他们访问项目页面并使用搜索功能(我指的是内部搜索引擎和外部搜索引擎,例如 Google)。您可以从访问者的事件中获取信息,例如,设置访问量最大的项目的顺序,那么您应该将更多的人力集中在列表的顶部,而不是“长尾”。
关于database - 收集、维护和确保庞大数据集准确性的最佳实践是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4505502/
我们已经在我的工作场所使用 SVN 几年了,自从我们安装它以来,除了更新和备份之外,我们真的没有对其进行任何类型的维护。我们还应该做些什么来维护 SVN,或者我们已经做了所有我们真正需要做的事情吗?
正则表达式模式如下: ".*/.*/.*/.*/.*/.*/(.*)-\d{2}\.\d{2}\.\d{2}.\d{4}.*" 确实很难维护。 我想知道,有没有这样的东西: ".*/.*/.*/.*/
我已经搜索了一些,但没有找到任何对我有帮助的问题/答案。问题是我的 jQuery 函数调用变得太大而无法维护。我想知道我是否应该进行更多重构,或者是否有更好的方法来完成所有这些调用。当我进行一次调用时
我在 mySql 中有一个记录表。我需要按照用户指定的方式为它们维护订单。所以我添加了一个“位置”列。 当我移动特定记录时更新所有记录的 SQL 语句是什么?我有类似的东西: UPDATE items
我正在使用 go channels 作为类似队列的机制,这非常适合我。我正在为每个用户打开这些类似队列的 channel 之一,并为这些 channel 中的每一个都有一个 for-range 循环。
使用 docker,您可以非常好地基于其他图像创建图像。例如,您可以制作一个镜像 Java-jdk7(基于最新的 Ubuntu LTS),并在此基础上创建镜像 elastic-search 和 tom
我正在用 Bash 编写脚本。 我的关联数组有问题,当我像这样在我的数组中放置一条记录时: declare -A arr_list_people_name 我将文本放入循环关联数组的方式(将文本排序)
我目前正在开发一个系统,该系统需要在没有可用互联网连接的情况下安装 python(或者至少我不能假设有可用的互联网连接), 我想知道维护 PIP 存储库的间接费用是多少,而且这样的存储库也可能会满足系
我正在考虑使用 Chrome 扩展的国际化支持,如 here 所述. 建议的翻译方法是先创建英文 messages.json 文件,然后将其复制并翻译成给定的语言。 我的问题是,这对于初始翻译来说工作
我想在(自托管)bitbucket 服务器中克隆 github 存储库,并不时从 github 存储库中提取最新更改。在我们的克隆中,我们将做一些永远不会离开我们的存储库的实验性内容。 为了显示;对于
我的应用程序基于银行域,需要 session 处理。当应用程序空闲时(应用程序打开后没有任何触摸事件)必须在后台计算时间。 当应用程序进入前台时,我处理 session 维护以及 AppDelegat
我可以保持 UISegmentViewControl 段的选定状态吗?即,即使用户选择了另一个段,也可以保持一个段显示为选中状态?我似乎在任何地方都找不到任何可以做到这一点的东西!! 最佳答案 这是不
我的要求:我想将登录详细信息(电子邮件、密码)发送到服务器,必须保持有效用户名的 session 。 如何使用 iphone SDK 的“NSURLConnection”创建和维护 session ?
就像Carl's question over here我想问你(因为我自己找不到 :( ) 删除既不是静态也不是动态(例如通过反射)使用的程序集引用是否有任何好处。 最佳答案 除了清理项目之外,删除未
我使用的是Bootstrap 3。我目前有2个页面,一个是查看页面,一个是编辑页面。两个页面都有许多导航选项卡,例如 id= tab1、tab2、tab3。 我想要实现的是,当我在查看页面的 tab2
我正在创建 Chrome 应用程序,我希望我的用户在首次进入应用程序时登录或创建用户。 目标: 在 Chrome 打包的应用程序上维护登录状态。 问题: Cookie - Chrome 打包的应用程序
我有arm模板来使用资源及其设置重新创建资源组。这工作得很好。 用例: 一些开发人员访问 Azure 门户并更新某些资源的某些设置。有没有办法获得可以应用于我的模板的精确更改以使这些更改生效? (更新
我有一个包含三个组合框的表单,一个代表该月(可能的)31 天,第二个代表代表月份的 12 个数字,第三个代表与 future 五年相对应的年份值。 我将它们连接在一起形成一个日期 TheDay = C
我有一个打开多个 JIF 的应用程序,但我只想创建 JIF 的单个实例,因此我使用这些函数来检查这一点,并在按下某个键后使用 dispose 关闭 JIF(JDesktopPane. getSelec
我想为一个项目制作一个帐户屏幕,但我对 GUI 还很陌生。这是我第一次使用 JComboBox,但遇到了一些麻烦。我基本上想将 JComboBox 放置在一个盒子内,这将成为我的背景图像的一部分。我尝
Tôi là một lập trình viên xuất sắc, rất giỏi!