-
-
0一、分析维度确定 ü监测对象确定:个股/单个企业 ü媒介数据指标确定:情绪值、评价值 ü金融数据指标确定:股价 二、数据提炼处理 ü媒介数据处理:情感分析+专业评价(看涨看跌观点提炼---词库构建) ü股市数据处理 三、数据拟合与预测 ü采用向量自回归模型(VAR)和格兰杰因果关系分析法来分析股价变动与媒介数据(情绪值&评价值)变化的相关性 四、时序数据采集 ü媒介数据采集:两微一端全网全域 ü股市数据采集:垂直门户/行业媒体
-
0日常生活中,存在各式各样的数据。如显示器的长宽高重量等数据,打电话时的语音数据,看电影时的语音和视频数据,这些数据都体现着不同的自身特性。 随着人类的进步,对数据的记录经历了大脑、结绳、石刻、龟甲、兽骨、竹子、金属、丝绸、纸张和硬盘(闪存、磁带)等记录载体。无论采用何种记录载体,都需要按照一定的组织方式进行存储(记录)。比如,记录一件事,需要组织语言结构;记录某一个物体的大小,可以借助物体的长宽重
-
01、指标设置上: ü逐渐丰富化,从单纯的总阅读、总点赞,逐步扩充到总阅读、总点赞、平均阅读、平均点赞、最大阅读、最大点赞六项指标; ü去除干扰性较大、易人为提升的指标:点赞率(容易人工调控) ü去除周期性影响,采用日均、篇均ü 2、标准化方式上: ü去除组间影响(账号统一评价,不设分组); ü去除整体样本影响,采用对数标准化,不涉及样本标准差、均值等参数,便于增设样本作比较; ü去除指标项之间的量级差影响,对单个
-
0一、指标选择 筛选确定评估维度和量化指标: ü指标关联性 ü指标重要性 ü数据可抓取 ü人为调控可能 二、算法确定 确定标准化方式和汇总算法: ü各指标量级统一 ü去除组间影响 ü去除样本影响 ü机器操作难度 三、权重设置 确定单项指标和各大维度的权重分配: ü侧重于原创内容 ü侧重于阅读指数 ü侧重于平均质量 ü专家打分&层次分析 四、数据测试 根据测试结果对指标、算法、权重作调整: ü保证分布合理 ü去除阶梯分段 ü异常值处理 ü第
-
0一、通用媒介大数据 Ø指数大数据 Ø舆情大数据 Ø网络管理大数据 Ø行业通用大数据(环保/金融) 二、行业垂直大数据 Ø垂直社区、论坛、APP Ø垂直门户网站 Ø行业媒体 Ø聚合行业UGC、PUGC 三、企业机构私有数据 Ø行业企业OA系统 Ø企业内部数据库 Ø企业信息库 Ø企业财报 四、行业用户大数据 Ø企业机构CRM系统 Ø用户背景信息数据 Ø用户使用/购买行为数据 Ø用户场景情境数据 舆情大数据关注点: ü从通用媒介大数据、垂直行业大数据,到行业私有数
-
0经核实吧主tiantianchike9 未通过普通吧主考核。违反《百度贴吧吧主制度》第八章规定http://tieba.baidu.com/tb/system.html#cnt08 ,无法在建设 舆情导控吧 内容上、言论导向上发挥应有的模范带头作用。故撤销其吧主管理权限。百度贴吧管理组